物种库
 
首页 > 保护界动态 > 保护动态

中国植物志/云南植物志问答系统正式上线服务

媒体:原创  作者:植物园联盟   专业号:植物园联盟 2025-09-03 10:19:18

植物志书中记载了植物的分类信息、描述信息、分布信息和用途信息等,由于植物的描述信息、分布信息和用途信息主要以非结构化的文本内容为主,因此传统检索植物志的方法主要是按结构化程度较高的植物分类信息进行检索,如:输入植物的中文名称或拉丁名称检索植物的信息(中国植物物种信息数据库,https://db.kib.ac.cn/Default.aspx)。

大语言模型经过多年的快速发展,其对自然语言的处理能力已非常成熟,但使用通用大语言模型查询植物的相关信息时依然会出现幻觉(如图1,使用DeepSeek问了一个并不存在的物种拉丁名Arachis cuspidata),其原因主要是由于通用大语言模型是基于概率计算生成文本答案。

图1DeepSeek出现幻觉示例

如何实现以自然语言的方式对植物志进行检索并降低通用大语言模型出现幻觉的概率呢?中国科学院昆明植物研究所科学数据中心基于大语言模型、数据库、知识图谱和知识库等技术,通过对植物志数据进行结构化提取、组织加工、图谱构建和知识向量化,构建了结构化的关系型数据库、基于知识图谱的图数据库和向量化知识库,从而研发实现基于大语言模型技术和数据融合的中国植物志/云南植物志问答系统(如图2,http://agent.iflora.cn:8080),相对于传统的检索植物志方法,本问答系统具有更灵活的检索方式,如可输入任意自然语言进行检索植物信息,且相对于通用大语言模型具有更高的准确性。

图2中国植物志/云南植物志问答系统

该项工作得到了云南省技术创新人才培养对象和中国科学院昆明植物研究所所级中心能力建设等项目的支持。

阅读 240
版权声明:
1.依据《服务条款》,本网页发布的原创作品,版权归发布者(即注册用户)所有;本网页发布的转载作品,由发布者按照互联网精神进行分享,遵守相关法律法规,无商业获利行为,无版权纠纷。
2.本网页是第三方信息存储空间,阿酷公司是网络服务提供者,服务对象为注册用户。该项服务免费,阿酷公司不向注册用户收取任何费用。
  名称:阿酷(北京)科技发展有限公司
  联系人:李女士,QQ468780427
  网络地址:www.arkoo.com
3.本网页参与各方的所有行为,完全遵守《信息网络传播权保护条例》。如有侵权行为,请权利人通知阿酷公司,阿酷公司将根据本条例第二十二条规定删除侵权作品。