10分钟校对40万字,《大辞海》AI审校还有哪些强项?

10分钟校对40万字,《大辞海》AI审校还有哪些强项?

admin 2025-03-26 上海软文合集 1 次浏览 0个评论

AI在各领域崭露头角之时,《大辞海》也加入其中,推出AI审校系统。3月25日,上海辞书出版社与百度、鲸汤(上海)智能科技有限公司在沪正式发布最新产品“辞文智能知识审校系统”。该产品是《大辞海》权威知识库与百度文心大模型深度融合的创新成果,标志着出版行业智能化转型迈入新阶段。

上海世纪出版集团副总裁、上海辞书出版社社长秦志华介绍,“辞文智能知识审校系统”系统目前可以在10分钟之内完成40万字文本量的审校,错误识别准确率达到80%,审校工作效率成倍提升,有效解决传统文本审校在知识性、逻辑性方面的痛点。

国内首个融合权威工具书资源的智能审校解决方案

作为国内首个融合权威工具书资源的智能审校解决方案,“辞文”实现了四大技术突破:一是精准的知识溯源能力,当发现错误时,系统不仅能指出问题所在,更能通过Agent技术精准定位到《大辞海》中的相关条目,展示完整的知识链条,让用户不仅知道“错在哪里”,更明白“正确的应该是什么”;二是强大的多轮推理能力,可深入验证文本多维度合理性,找出隐藏的逻辑谬误,比如当审核一篇关于历史人物的文章时,系统不仅是简单地核对年代,而是会通过多重推理,验证人物关系、历史背景、事件顺序等多个维度的合理性;三是动态的知识更新机制,确保核查结果紧跟学术发展前沿,当《大辞海》数据库有更新时,系统能自动完成知识的同步;四是智能的交互式审校流程,通过有效控制大模型的发散、幻觉问题,提供个性化的审校建议,这种人机协作的方式既保留人工审校的专业判断,又发挥AI的效率优势。

与市面上现存智能审校系统相比,“辞文智能知识审校系统”的优势在于其依托的《大辞海》数据库。

《大辞海》共收词近30万条,5000多万字,涵盖目前所有的一级和二级学科,是自然科学、人文社会科学、语言文字等学科名词、术语、概念等各方面知识的集大成者。

“《大辞海》犹如为 AI配备了‘权威知识的放大镜、显微镜’。”秦志华表示,在人工智能在知识审校领域,内容数据的准确性决定整个建筑的稳固程度。依托《大辞海》,“辞文”智能知识审校系统能够快速、准确地识别各类文本中的细微知识谬误,精确考证历史年代、严格遵循木语规范、确保人物事实准确。

实现从“文字纠错”到“知识审校”的能力跨越

近几年,文本审校工具如雨后春笋不断涌现,从早期的黑马校对、方正审校,到i校对、凤凰智能校对系统、蜜度校对通、果麦AI校对王等产品各擅胜场。

“辞文”系统依托《大辞海》,将定位瞄准“知识审校”。“2023年8月起执行的《图书编校质量差错判定和计算方法》中规定,一般性错字、别字,每处计1个差错;知识性、逻辑性差错,每处计2个差错,由此可见知识性、逻辑性差错对编校质量管理而言极为重要。然而,随着知识专业化分工的日益精细,单个审校人员难以完全掌握跨学科知识,市场迫切需要一套智能、高效、准确的知识审校系统。这不仅是新闻出版机构、内容发布平台的把关利器,也将是整个内容创作行业的前置工具。”秦志华表示。

在这样的背景下,上海辞书出版社很早就关注到了“智能审校”。“‘辞文智能知识审校系统’并不是我们一时兴起赶潮流的数字产品。最初产生开发智能审校系统的想法,可能要追溯到2019年。”秦志华介绍,当时上海辞书出版社正围绕《辞海》数字出版云平台的建设,开发工具书协同编纂的子系统,其中就包括历史纪年、古今地名、规范汉字、引文和译名统一等自动核查功能。当时,他们就将智能审校这一知识服务方向放在了出版融合的“代办清单”中。

2023年6月,上海辞书出版社与百度文心一言合作,正式立项“辞文”智能审校项目,后来,鲸汤(上海)智能科技有限公司加入,在数据、算法、算力方面密切配合,推动大辞典与大模型深度融合。经过3轮外部测试,“辞文智能知识审校系统”正式推出,实现从“文字纠错”到“知识审校”的能力跨越。

“AI的质量与差异主要来自于数据,站在《大辞海》权威基础上做出的这个智能审校产品,基础非常好。”百度 AI 技术生态副总经理周奇表示,大模型时代,软件产品是“火的”,可以根据数据、用户反馈和大模型本身成长不断迭代,依托文心+飞桨的核心技术,百度致力于希望和硬件伙伴、技术伙伴、数据伙伴等共建生态,架起技术和行业专业知识的桥梁,打通大模型垂直领域应用的工程化“最后一公里”。

秦志华介绍“辞文”系统

守护知识传播的准确性与严肃性

发布会上,秦志华展示了部分“辞文”应用的案例。上海辞书出版社针对该社一部50多万字的关于上海历史主题的付型稿件,采用“辞文”进行深度检测,系统共标记471处潜在错误,经专业编辑团队逐条复核,最终确认采纳87处知识性差错(含历史事件误记、人物关系错位、地理沿革错误等),错误类型覆盖上海开埠史、租界制度、地方文献等专业领域。横向对比测试数据显示,“辞文”系统检出471处,确认采纳87处;市场上另一审校产品检出262处,确认采纳0处。

王敏分享使用体验

《咬文嚼字》编辑部也体验了这一产品。上海咬文嚼字文化传播有限公司总经理王敏介绍试用情况,通过对一些已知错误的文本进行测试,“辞文”系统的修订值得参考。例如一段文本中错将“多情总被无情恼”这句苏轼的词作写成是“出自元好问之手”,“辞文”系统第一次将其改成“并非出自元好问之手”,第二次则直接纠错为“出自苏轼之手”。

“智能校改两次内容不一样,第二次修订内容还有进步。”王敏认为,在大模型助力下,通过人机协同,这一产品有很大潜力。

“我做新闻20多年,最怕白纸黑字印出去的知识出错。” 经济日报社上海记者站站长 李治国感慨,在做新闻报道时,记者编辑面对海量信息难免有疏漏,比如历史事件的日期、科技概念的界定等都是跨领域的内容,“‘辞文’系统既具备AI的高效,又扎根于《大辞海》权威知识体系,能在几秒内完成交叉验证,帮助我们守住事实底线。媒体的价值在于权威性和准确性,通过前沿的技术,我们能提高工作效率,专注于更有创造性的工作。”

秦志华表示,“辞文”突破以往各类文本审校工具的局限,实现了从“文字纠错”到“知识审校”的能力跨越,但其价值更在于守护知识传播的准确性与严肃性。据悉,目前该产品已成功应用于人文社科、科学技术等出版领域的文本审校,未来还将拓展至新闻传媒、教育科研等场景,致力于成为内容生产领域的“数字质检员”。

转载请注明来自亚星官网-亚星开户-亚星会员开户,本文标题:《10分钟校对40万字,《大辞海》AI审校还有哪些强项?》

每一天,每一秒,你所做的决定都会改变你的人生!