《科创板日报》记者第一时间下载并实测体验,目前该版本支持手机号码、抖音、以及苹果账号登录,用户可以通过与豆包进行对话,生成歌词、小说、文案等文本内容。每段回答除了文字外,也会由数字人豆包进行语音回答。
从实测体验来看,豆包对语义的理解表现不俗,也具备一定的数理逻辑能力,对部分问题的回答甚至超过了文心一言、通义千问的初次测试版本。不过,依然难以避免生成式AI存在的“一本正经胡说八道”问题。
首先,记者提问:你是谁?

《狂飙》可谓今年最热的电视剧之一,记者让其为剧中的主角高启强改写一个结局。

从回答来看,豆包完成得还不错。
提问:国内涉足预训练大模型的公司有哪些?

在回答中,豆包把“字节跳动”的云雀模型列在了最前面。对于其他公司的回答则存在错误。比如,紫霄为腾讯的AI推理芯片,而非大模型的名称。
提问:特斯拉在国内过去五个月、过去一年的销量是多少?

豆包的回答较为有逻辑性,在语言组织上比文心一言、通义千问的最初版本表现更好,但数据准确性仍不足。
从记者的初步搜索来看,根据乘联会发布新能源汽车销售数据,特斯拉中国的5月销量为77695辆,其他所列举的数据也并不准确。
鸡和免放在一只笼子里,上面有 29 个头,下面有 92 只脚。问: 笼中有鸡、兔各多少只?

豆包顺利地答对了“鸡兔同笼”的数学题。
提问:李明是李丽的哥哥,刘云是李丽的妈妈,李明是刘云的谁?

豆包同样答对了。
提问:写一首祝你生日快乐的藏头诗

提问:写一句 AI 医疗公司可以使用的中秋节海报文案

提问:请帮我写一封采访邀约的介绍信

豆包在对话界面中还内嵌了“搜索功能”,可以在互联网上搜索采访邀约的介绍信的相关内容。

除了豆包外,字节还提供了“超爱聊天的小宁”、“英语学习助手”、“全能写作助手”的对话角色。

“超爱聊天的小宁”

“英语学习助手”

记者测试了“全能写作助手”的功能,要求其对一段文字进行润色,并取个标题。

AI助手的完成度还不错。

从测试来看,“豆包”尚不支持AI绘画。