gpt4o观测

在这次openai发布会,发布了gpt4o,简单的说,openai的目标一直都是朝着《太空漫游2012》去的,所以更强调交互性,给我一种感觉就是他们希望完美通过图灵测试,让人完全感觉不到这个模型是一个工具而是一个人,当然,人在某个程度上也是一个工具。

要点:

  • 实时多模态能力,
  • 2x 速度
  • 50% 偏移
  • 5x速度限制
Read more

循环神经网络 rnn

卷积网络(cnn)是用来处理空间信息(一张图像),循环神经网络(rnn)则用来处理序列信息(一句话,一个视频的图像帧,温度的变化序列)
rnn引入了状态变量存储序列信息和当前输入,从而预测下一个输入,以此不断循环,预测整段序列信息。

Read more

number gpt

skip了环境准备,数据下载和数据清洗

Read more

mini-gpt

karpathy 的300行mini-gpt

karpathy 300行实现了mini-gpt,是一个很好的学习范例。

Read more

bahdanau注意力

bahdanau注意力机制的初心

本意是为了seq2seq学习而设计出的编码器解码器架构,有个弊端。
对于编码器:

Read more

多头注意力

自注意力的意思是,query,key,value都是同一个X。
说明一个词语会咨询所有其他的词元,看其相似度来计算value值。
所以最后演变成下面的结构。

Read more