ad

word2vec guesing单词嵌入-英雄云拓展知识分享

匿名投稿 288 2024-01-22

Word2Vec可以用来猜想单词吗?用大数据集训练了模型,例如Google新闻如何使用Word2Vec预估一个仅使用上下文的类似单词,例如随着“在国际象棋统治超过15年的统治者中,将与密苏里州圣路易斯的9名顶级球员竞争”。输出应当是卡斯帕罗夫或卡尔森。

我乃至只看到类似性API,但我没法使用它们来使用它们?这不是Word2Vec打算使用的方式吗?

看答案

这不是Word2Vec的预设用处。该词2VEC算法在内部尝试使用周围的单词来预估精确的单词,作为一种为周围单词学习有用的向量的回旋方式。

word2vec guesing单词嵌入-英雄云拓展知识分享

但是即使如此,在培训期间,它也不会构成确切的预估。它只是查看一个狭窄的训练示例 - 上下文单词和目标词 - 并进行非常简单的比较和内部轻推,以使其与该示例的一致性稍好一些。随着时间的流逝,即便预估依然具有巨大变化的质量,这类自我调剂也会对有用的向量。

大多数Word2Vec库不提供给定上下文单词的直接界面来显示排名的预估。 Python Gensim库,用于最后几个版本(截至2017年7月2.2.0版),已提供了一个 predict_output_word() 对某些培训模式,大致显示模型将在上下文字中预估的方法。看:

https://radimrearurek.com/gensim/models/word2vec.html#gensim.models.word2vec.word2vec.predict_output_output_word

但是,斟酌到您的填充查询(在相干教育或机器学习环境中也称为“固定删除”):

_____, who dominated chess for more than 15 years, will compete against nine top players in St Louis, Missouri

Vanilla Word2Vec模型不太可能正确。它对单词的相对重要性几近没成心识(除非某些单词更狭narryther狭窄地预估了其他单词)。它没有语法/顺序的感觉,也没有连接词的组成词(例如“主导的国际象棋”,而不是单独的单词“主导”和“国际象棋”)。即便描写相同事物的单词通常彼此接近,它也不知道能够肯定空白必须是“人”和“国际象棋棋手”,而Word2vec的模糊类似的地方'保证一堂课一定要比其他话语更接近。

已有很多工作来训练单词/概念向量(又称“密集的嵌入”),以更好地帮助解决此类问题的任务。一个随机的示例多是 “创建因果关系以经过最小的监督来回答问题” 但是[Word2Vec Question Ablesing]或[发问回答的嵌入]之类的查询会发现更多。不过,某些情况下,我不知道有或没有Word2Vec的关键,因此不知道很容易做到这一点。


🚀🌟 点击注册 免费试用超级应用平台-英雄云企业级hpapaas 🌟🚀 😃👉🌐

免责声明:

本网址(www.yingxiongyun.com)发布的材料主要源于独立创作和网友匿名投稿。此处提供的所有信息仅供参考之用。我们致力于提供准确且可信的信息,但不对材料的完整性或真实性作出任何保证。用户应自行验证相关信息的正确性,并对其决策承担全部责任。对于由于信息的错误、不准确或遗漏所造成的任何损失,本网址不承担任何法律责任。本网站所展示的所有内容,如文字、图像、标志、音频、视频、软件和程序等的版权均属于原创作者。如果任何组织或个人认为网站内容可能侵犯其知识产权,或包含不准确之处,请即刻联系我们进行相应处理。

标签:CRM系统 命名空间 应用快速搭建
上一篇:bash-在目录中查找重复文件并重命名-英雄云拓展知识分享
下一篇:我的页脚去了哪里-英雄云拓展知识分享
相关文章

 发表评论

暂时没有评论,来抢沙发吧~

×