MOSS最大短板是中文水平不够高:中文网页广告太多


(相关资料图)

ChatGPT发布以来,基于指令学习技术的类ChatGPT模型在我国能否开发成功,成为业界关注的一个焦点。解放日报·上观新闻记者从复旦大学自然语言处理实验室获悉,国内第一个对话式大型语言模型MOSS已由邱锡鹏教授团队发布至公开平台,邀公众参与内测。

目前,MOSS的最大短板是中文水平不够高,主要原因是互联网上中文网页干扰信息如广告很多,清洗难度很大。为此,复旦大学自然语言处理实验室正在加紧推进中文语料的清洗工作,并将清洗后的高质量中文语料用于下一阶段模型训练。科研团队相信,这将有效提升模型的中文对话能力。

推荐DIY文章
元宇宙不止是畅想 “科幻畅想 元宇漫游” 主题论坛开讲 疫情之后京城首场元宇宙科技概念展亮相石景山
Win10命令提示符已被系统管理员停用如何解决 为什么会出现这种情况
如何用一键ghost安装win7 如果你还对装系统有疑问 可以看看本教程
【新要闻】win10所有word文档都打不开怎么办 建议重新选择word程序
怎么升级Win10创意者更新?感兴趣的用户可以一起来体验看看|快看
热门看点:C盘空间不够用怎么扩容 分区助手专业版软件可以帮您解决问题
精彩新闻

超前放送