10分钟校对40万字，《大辞海》AI审校还有哪些强项？

admin 2025-03-26 上海软文合集 2 次浏览 0个评论

AI在各领域崭露头角之时，《大辞海》也加入其中，推出AI审校系统。3月25日，上海辞书出版社与百度、鲸汤（上海）智能科技有限公司在沪正式发布最新产品“辞文智能知识审校系统”。该产品是《大辞海》权威知识库与百度文心大模型深度融合的创新成果，标志着出版行业智能化转型迈入新阶段。

上海世纪出版集团副总裁、上海辞书出版社社长秦志华介绍，“辞文智能知识审校系统”系统目前可以在10分钟之内完成40万字文本量的审校，错误识别准确率达到80%，审校工作效率成倍提升，有效解决传统文本审校在知识性、逻辑性方面的痛点。

国内首个融合权威工具书资源的智能审校解决方案

作为国内首个融合权威工具书资源的智能审校解决方案，“辞文”实现了四大技术突破：一是精准的知识溯源能力，当发现错误时，系统不仅能指出问题所在，更能通过Agent技术精准定位到《大辞海》中的相关条目，展示完整的知识链条，让用户不仅知道“错在哪里”，更明白“正确的应该是什么”；二是强大的多轮推理能力，可深入验证文本多维度合理性，找出隐藏的逻辑谬误，比如当审核一篇关于历史人物的文章时，系统不仅是简单地核对年代，而是会通过多重推理，验证人物关系、历史背景、事件顺序等多个维度的合理性；三是动态的知识更新机制，确保核查结果紧跟学术发展前沿，当《大辞海》数据库有更新时，系统能自动完成知识的同步；四是智能的交互式审校流程，通过有效控制大模型的发散、幻觉问题，提供个性化的审校建议，这种人机协作的方式既保留人工审校的专业判断，又发挥AI的效率优势。

与市面上现存智能审校系统相比，“辞文智能知识审校系统”的优势在于其依托的《大辞海》数据库。

《大辞海》共收词近30万条，5000多万字，涵盖目前所有的一级和二级学科，是自然科学、人文社会科学、语言文字等学科名词、术语、概念等各方面知识的集大成者。

“《大辞海》犹如为 AI配备了‘权威知识的放大镜、显微镜’。”秦志华表示，在人工智能在知识审校领域，内容数据的准确性决定整个建筑的稳固程度。依托《大辞海》，“辞文”智能知识审校系统能够快速、准确地识别各类文本中的细微知识谬误，精确考证历史年代、严格遵循木语规范、确保人物事实准确。

实现从“文字纠错”到“知识审校”的能力跨越

近几年，文本审校工具如雨后春笋不断涌现，从早期的黑马校对、方正审校，到i校对、凤凰智能校对系统、蜜度校对通、果麦AI校对王等产品各擅胜场。

“辞文”系统依托《大辞海》，将定位瞄准“知识审校”。“2023年8月起执行的《图书编校质量差错判定和计算方法》中规定，一般性错字、别字，每处计1个差错；知识性、逻辑性差错，每处计2个差错，由此可见知识性、逻辑性差错对编校质量管理而言极为重要。然而，随着知识专业化分工的日益精细，单个审校人员难以完全掌握跨学科知识，市场迫切需要一套智能、高效、准确的知识审校系统。这不仅是新闻出版机构、内容发布平台的把关利器，也将是整个内容创作行业的前置工具。”秦志华表示。

在这样的背景下，上海辞书出版社很早就关注到了“智能审校”。“‘辞文智能知识审校系统’并不是我们一时兴起赶潮流的数字产品。最初产生开发智能审校系统的想法，可能要追溯到2019年。”秦志华介绍，当时上海辞书出版社正围绕《辞海》数字出版云平台的建设，开发工具书协同编纂的子系统，其中就包括历史纪年、古今地名、规范汉字、引文和译名统一等自动核查功能。当时，他们就将智能审校这一知识服务方向放在了出版融合的“代办清单”中。

2023年6月，上海辞书出版社与百度文心一言合作，正式立项“辞文”智能审校项目，后来，鲸汤（上海）智能科技有限公司加入，在数据、算法、算力方面密切配合，推动大辞典与大模型深度融合。经过3轮外部测试，“辞文智能知识审校系统”正式推出，实现从“文字纠错”到“知识审校”的能力跨越。

“AI的质量与差异主要来自于数据，站在《大辞海》权威基础上做出的这个智能审校产品，基础非常好。”百度 AI 技术生态副总经理周奇表示，大模型时代，软件产品是“火的”，可以根据数据、用户反馈和大模型本身成长不断迭代，依托文心+飞桨的核心技术，百度致力于希望和硬件伙伴、技术伙伴、数据伙伴等共建生态，架起技术和行业专业知识的桥梁，打通大模型垂直领域应用的工程化“最后一公里”。

秦志华介绍“辞文”系统

守护知识传播的准确性与严肃性

发布会上，秦志华展示了部分“辞文”应用的案例。上海辞书出版社针对该社一部50多万字的关于上海历史主题的付型稿件，采用“辞文”进行深度检测，系统共标记471处潜在错误，经专业编辑团队逐条复核，最终确认采纳87处知识性差错（含历史事件误记、人物关系错位、地理沿革错误等），错误类型覆盖上海开埠史、租界制度、地方文献等专业领域。横向对比测试数据显示，“辞文”系统检出471处，确认采纳87处；市场上另一审校产品检出262处，确认采纳0处。

王敏分享使用体验

《咬文嚼字》编辑部也体验了这一产品。上海咬文嚼字文化传播有限公司总经理王敏介绍试用情况，通过对一些已知错误的文本进行测试，“辞文”系统的修订值得参考。例如一段文本中错将“多情总被无情恼”这句苏轼的词作写成是“出自元好问之手”，“辞文”系统第一次将其改成“并非出自元好问之手”，第二次则直接纠错为“出自苏轼之手”。

“智能校改两次内容不一样，第二次修订内容还有进步。”王敏认为，在大模型助力下，通过人机协同，这一产品有很大潜力。

“我做新闻20多年，最怕白纸黑字印出去的知识出错。” 经济日报社上海记者站站长李治国感慨，在做新闻报道时，记者编辑面对海量信息难免有疏漏，比如历史事件的日期、科技概念的界定等都是跨领域的内容，“‘辞文’系统既具备AI的高效，又扎根于《大辞海》权威知识体系，能在几秒内完成交叉验证，帮助我们守住事实底线。媒体的价值在于权威性和准确性，通过前沿的技术，我们能提高工作效率，专注于更有创造性的工作。”

秦志华表示，“辞文”突破以往各类文本审校工具的局限，实现了从“文字纠错”到“知识审校”的能力跨越，但其价值更在于守护知识传播的准确性与严肃性。据悉，目前该产品已成功应用于人文社科、科学技术等出版领域的文本审校，未来还将拓展至新闻传媒、教育科研等场景，致力于成为内容生产领域的“数字质检员”。