又是很长一段时间没更新博客了,这个暑假非常忙,也稍微做出了一点成果,接下来会继续在博客上分享~ 今年以来,大模型以及相关的应用很火,其中就有一种叫「向量数据库」的东西,向量数据库主要用来存储向量和提供向量查询功能,其中用到的向量如何 ...
a = torch.tensor([[1,2,3,4],[2,3,3,4]]) #表示输入有2个batch,每个序列长度为4 #词嵌入(也是一个层,对输入做计算,就是把输入的每一个编码成一个向量) ebd1 = nn.Embedding(5,24) #定义词汇表长度是5,每个词汇编码为长度24的向量 ...
ACL 2020 于 5 月 17 日放榜啦,在此祝贺、羡慕每一位论文被接收的朋友。 以下汇总并尝试按主题分类了 37 篇与 word embedding 有关的长文,让我们一起看看今年词嵌入的研究又有哪些新进展。 关于作者:张正,坐标巴黎,上班NLP,下班词嵌入。 纵向分类 一千个人 ...
许可协议:署名-非商业性使用-禁止演绎 4.0 国际转载请保留原文链接及作者。 在实现自然语言处理(NLP)任务时,我们需要处理不同类型的离散类型。最明显的例子是单词。单词来自一个有限的集合(也就是词汇表)。其他离散类型的示例包括字符、部分语言 ...