2025数博会上演“人机难辨” 方寸智脑通过“图灵测试”
2025中国国际大数据产业博览会(简称2025数博会)28日开幕。在2025数博会专业展览现场,一场别开生面的“图灵测试”引发广泛关注。方寸无忧旗下产品“方寸智脑”在随机双盲测试中,成功让53.70%的现场观众认为是政府网站的“真实公文”。这意味着“方寸智脑”公文写作智能体已顺利通过“图灵测试”,意味着其在公文写作场景下的表现达到“人机难辨”的水平。
“方寸智脑”的图灵测试采取随机双盲测试方法,受试者需要在10分钟内阅读6篇文章,并选出其认为是AI生成的内容。测试文章中有50%为公证员现场监督下生成的AI文本,另外50%为公证员随机抽取的人类文本。
本次测试总计2小时,共有72名观众参与测试成为“图灵测试官”,其中69%的观众来自政府机构、事业单位、国企等有公文写作需求的岗位。“图灵测试官”的学历也都久经“考场”验证,本科及以上学历占比99%,其中4%为博士,22%为硕士。
本次参与测试的“方寸智脑”,基于“专用模型底座+工具底座+文档底座”三大核心架构构建。方寸无忧CTO杨钢介绍:“专用模型底座融合了DeepSeek等前沿大模型与方寸自研的行业小模型,尤其针对政务、企业等垂直场景的语言逻辑与知识体系做了深度优化;工具底座集成包括公文写作、政策解读、数据校验等数十种专业工具,使AI能快速‘调用工具解决问题’;文档底座则依托9年来积累的800万篇优质文本与2000+客户实际案例,为生成‘贴合场景、符合规范’的文本提供坚实基础。”
53.7%的“图灵测试”结果并非偶然,而是方寸无忧多年来在行业数据、模型与算法等方面持续深耕的成果。方寸无忧创始人张在萍说:“作为一家以‘产品改变世界,AI助力梦想’为愿景的AI产品公司,方寸始终坚信政企场景的AI不应是‘通用炫技’,而应‘精准解决问题’,帮助人更专注于有温度、有价值的工作。”
“很多人认为AI文本生成只是‘模仿语言风格’,但公文的本质是‘决策信息的文本化’。”方寸无忧公文产品负责人梅俊博士表示,“此次测试中AI文本能被很多人认为是人类撰写,关键是我们让AI真正‘理解’了政务行为逻辑,以实际工作运行要求为指导调用多种工具进行创作。”
自2016年成立以来,方寸无忧坚持打造AI能力平台,随着AI技术的爆发式跃迁,方寸的自研模型能力和基于通用模型的应用开发能力也越来越强。“方寸智脑”是AI能力平台的最新成果。方寸AI能力平台推出的首款产品“智能政务审校”融入审校权威专家的专业知识经验,政务审校准确率达99%;第二款产品“方寸无忧智慧公文”将知名博士的写作方法论转化为可执行的AI逻辑;而第三款产品“方寸智脑”的公文写作智能体,进一步实现了“人机协同写得像、自主运行写得准、辅助决策写得优”的效能跃升。
下一步,方寸将行业知识编码为可执行的智能体,接管高频、重复、强规范类任务,辅助人类完成创造性工作,实现合规、可控、可量化的效率提升,让人可更专注于判断、创意与服务,提升工作的价值感与幸福感。(张伟)