ad

多种类型的OpenNLP名称实体培训-英雄云拓展知识分享

匿名投稿 280 2024-01-22

我有一个疑问,例如“指定代码有多少员工 <START:desigcd> 123 <END> 和薪水 <START:sal> 10000 <END> 或更多。

我已训练了 NameFinderME 处理此数据

NameFinderME.train("en", "desigcd", SampleStream, modelParams, desigNameFinderFactory);

//Training twice for different types of data

NameFinderME.train("en", "salary", SampleStream, modelParams, desigNameFinderFactory);

Span desigNumSpans[] = desigFinder.find(strInput.split(" "));

for(Span span : desigNumSpans)

{

多种类型的OpenNLP名称实体培训-英雄云拓展知识分享

//span.gets//

System.out.println(span);

System.out.println("Type="+span.getType());

System.out.println(strInput.split(" ")[span.getStart()]);

}

这将打印下输出。[3..4)desigcd type = desigcd 123 [8..9)desigcd type = desigcd 10000

为何要两次服用相同的类型(DesigCD)?这不是错吗?自从句子10000是Sal以来第2次打印时,它不应当是无效的吗?

看答案

关键是标签“ sal”和“ desigcd”都是数字。因此,这种情况下,尝试提一个辨别二者的功能。


🚀🌟 点击注册 免费试用超级应用平台-英雄云企业级hpapaas 🌟🚀 😃👉🌐

免责声明:

本网址(www.yingxiongyun.com)发布的材料主要源于独立创作和网友匿名投稿。此处提供的所有信息仅供参考之用。我们致力于提供准确且可信的信息,但不对材料的完整性或真实性作出任何保证。用户应自行验证相关信息的正确性,并对其决策承担全部责任。对于由于信息的错误、不准确或遗漏所造成的任何损失,本网址不承担任何法律责任。本网站所展示的所有内容,如文字、图像、标志、音频、视频、软件和程序等的版权均属于原创作者。如果任何组织或个人认为网站内容可能侵犯其知识产权,或包含不准确之处,请即刻联系我们进行相应处理。

标签:爪哇 NLP
上一篇:上传python套餐而无需重建-英雄云拓展知识分享
下一篇:如何清除ASP.NET中的所有主动会话-英雄云拓展知识分享
相关文章

 发表评论

暂时没有评论,来抢沙发吧~

×