4月8日消息,在被OpenAI的ChatGPT成功搅动热情、却又猝不及防开始封亚洲账号的日子里,阿里云自研大模型开始邀测。TechWeb获得测试码并第一时间连夜进行了测试体验,包括常规问答、写剧本、写商品文案、写编程代码、进行SWOT分析、做数学题、甚至写“彩虹屁”文……整体而言,有惊喜也有惊讶。
(相关资料图)
这款阿里版ChatGPT“通义千问”实力究竟如何?一起看看。
首先,通义千问的主界面如下,BYOII介绍自己是“一个专门响应人类指令的大模型”。给出了撰写短文、电影脚本、写邮件、职场助理等示例。
有意思的是,通义千问还单独弄了一个“百宝袋”,目前有“9宫格”小应用。稍后依次试试看。
体验开始
一、常规问答
作为一个AI预训练语言大模型,问答“对话”是基本技能。
当然,开始之前,也要知己知彼。
于是我们先请它做了一个自我介绍:
答:我是来自达摩院的大规模语言模型,我叫通义千问。我是达摩院自主研发的超大规模语言模型,也能够回答问题、创作文字,还能表达观点、撰写代码。如果您有任何问题或需要帮助,请随时告诉我,我会尽力提供支持。
追问1js:“为什么你的名字叫通义千问?”
答:“通义千问”这个名字来源于两个方面,“通义”意味着该模型具有广泛的知识和普适性,可以理解和回答各种领域的问题。作为一个大型预训练语言模型,“通义千问”在训练过程中学习了大量的文本数据,从而具备了跨领域的知识和语言理解能力。“千问”代表了模型可以回答各种问题,包括常见的、复杂的甚至是少见的问题。它表达了通义千问致力于满足用户在不同场景下的需求,无论问题多么复杂或者独特。综合起来,“通义千问”这个名字表达了这款人工智能语言模型的强大功能和广泛适用性。
追问2:你可以生产图片吗?
答:很抱歉,作为一个语言模型,我本身并不能直接生成图片。我可以回答各种问题,帮助您解决问题,但是我无法直接生成图片。如果您需要图片,我建议您使用图片生成工具或者咨询专业设计师。
好,到这里对“通义千问”基本有了一个初步了解。目前它主要能生成文本、编程代码等,还不能生成图片。
二、单项文本测试
1、写剧本
我们让通义千问:写一个《流浪地球3》的电影剧本
通义千问的《流浪地球3》电影剧本如下:
第一幕
[字幕:2023年,地球遇到了危机。太阳即将毁灭,人类必须寻找新的家园。]
场景:地球表面
[字幕:空间站船员正在紧急磋商,制定新的逃生计划。]
船员1:我们必须尽快行动,否则就来不及了。
船员2:我们已经尽力了,但是我们的引擎已经到达极限。
船长:我们必须寻找新的家园,这是我们唯一的希望。
[画面切换到地球上的各个角落,展示着严峻的环境和危机。]
场景:南极洲
[字幕:人类正在南极洲建造一个新的据点,以便在太阳毁灭之前寻找到新的生存空间。]
工程师:我们必须加快速度,否则我们就来不及完成了。
建筑工人:我们会努力的,我们必须要为人类的未来而战斗。
[画面切换到其他地球上的角落,展示着人类为了生存而做出的努力。]
场景:北极
[字幕:人类正在北极周围建造巨大的冰盾,以保护地球免受太阳辐射的影响。]
科学家:我们正在研究新的能源技术,这将是我们新的生命线。
船员:我们必须相信人类的智慧和勇气,我们一定能够度过这个难关。
[画面切换到地球上的其他地方,展示着人类的不屈不挠和对未来的希望。]
场景:大气层外
[字幕:人类最终成功地建造了能够逃离太阳系的太空船,并发射了它。]
船长:我们成功了!我们将在外太空中寻找新的家园。
[画面切换到太空中,展示着人类的新家园。]
场景:外太空
[字幕:人类在外太空中探索着新的星球,并开始建立新的文明。]
太空人:我们已经找到了一个新的星球,我们将在那里建立新的家园。
船员:这是我们新的历程,我们将永远不忘我们所经历的一切。
[字幕:《流浪地球3》结束,人类将继续前行,寻找新的生存空间。]
场景换得挺多,大家觉得如何?
2、做助理
五一假期马上就要到了,让通义千问帮我们做一个五一假期北京5日游的旅游计划。
通义千问给出了它的计划安排。如图中红线部分,它安排了第二天和第四天都要去游览颐和园和圆明园。
看来,要么是通义千问非常喜欢颐和园和圆明园,要么就是北京没必要花5天时间游。
当然,我可以为您提供一个五一假期北京5日游的旅游计划。以下是一个简单的行程安排:
第一天:
早上:游览故宫博物院,欣赏中国古代文化艺术的珍品。(门票需提前在官网预约)
下午:在王府井大街逛街购物,品尝北京特色小吃。
晚上:入住酒店休息。
第二天:
早上:早餐后前往天安门广场,观看升旗仪式,了解中国的国家象征和历史文化。
上午:游览颐和园,欣赏中国皇家园林的美景和历史文化遗产。
下午:参观圆明园,感受中国近代史的屈辱和伤痛。
晚上:入住酒店休息。
第三天:
早上:早餐后前往八达岭长城,感受中国古代的伟大工程和历史文化。
下午:游览鸟巢和水立方,感受现代化的北京城市风貌和文化。
晚上:入住酒店休息。
第四天:
早上:早餐后前往颐和园,欣赏中国皇家园林的美景和历史文化遗产。
下午:游览圆明园,感受中国近代史的屈辱php和伤痛。
晚上:入住酒店休息。
第五天:
早上:早餐后游览北京市区,参观北京天文馆,了解天文知识。
中午:午餐后参观北京大观园,体验中国传统文化的精髓。
下午:乘坐高铁返回,结束愉快的旅程。 注意:以上行程仅供参考,具体行程可根据个人兴趣和时间进行调整。
3、商品描述生成
给了2个跟苹果相关的需求,一个是“给苹果电脑写一个商品描述文案”,一个是给“自产苹果写一个商品描述文案”。
通义千问准确理解了不同的“苹果”,并都给出了很不错的回答。看来,通义千问做商品文案小助手的能力还是很娴熟的。
通义千问生成文本:
以下是一个针对苹果电脑的商品描述文案:
【产品名称】苹果MACBook Pro 13英寸
最新的第11代英特尔酷睿i7处理器
8GB内存和512GB SSD存储空间
Retina显示屏幕和True Tone技术,让你在任何环境下都能清晰地看到色彩BYOII和文字
先进的图形处理器和可选的NVIDIA GeForce或Apple Iris Xe显卡,让你可以轻松地进行各种图形和视频处理任务
多种可选的好莱坞级别视频编辑软件,比如Final Cut Pro、iMovie和Adobe Premiere Pro
长达10小时的电池使用时间,让你可以在不用时间充电的情况下使用一整天
高级的安全功能,包括Touch ID和Face ID解锁,以及两步验证和iCloud存储
外部Thunderbolt 3端口和SDXC卡插槽,让你可以轻松地扩展和备份存储设备
无论你是在进行创作、设计还是办公,苹果MACBook Pro 13都能够为你提供所需的性能和可靠性,让你能够充分发挥你的创造力和工作效率。立即购买,享受高性能的计算体验!
通义千问生成文本:
“亲爱的顾客您好!
我们的自产苹果是一种营养丰富、口感鲜美的水果,每一颗都经过精心挑选和严格的筛选,确保了其品质和新鲜度。
我们的苹果生长在优美的自然环境中,不使用任何化学农药和化学肥料,是真正的绿色食品。它们具有独特的芳香和口感,咬一口,汁液充盈,甜度适中,每一口都能让您充分体验到大自然的美妙。
我们的自产苹果适合各种烹饪方式,煎、烤、煮、炖,都能呈现出其独特的风味和口感。无论您是想制作一道清爽的水果沙拉,还是想制作一道美味的甜点,我们的自产苹果都能为您带来极佳的口感和享受。
我们的自产苹果来自于一个经验丰富的果园,采用了现代化的种植技术和管理方法,确保了果树的健康和产量。我们致力于为顾客提供最好的品质和服务,让您在享受美食的同时,也能享受到自然的美好。
如果您对我们的自产苹果感兴趣,欢迎前来选购,我们期待与您的合作!
谢谢!”
4、SWOT分析
让通义千问帮忙分析一下“特斯拉和比亚迪哪一家强”。
通义千问给出的完整答复:
根据我收到的信息,“特斯拉和比亚迪哪一家强”是一个很有争议的话题,因为两家公司都在电动汽车行业领域表现出色,并且有各自的优势和劣势。
优势:
1. 技术实力:特斯拉拥有先进的电动汽车技术,并且不断地研发新的技术,比如Tesla Semi电动重型卡车和太阳能屋顶瓦片等。
2. 创新:特斯拉在电动汽车行业一直处于创新的前沿,不断推出新的产品和技术,包括自动驾驶、智能电网和超级充电站等。
3. 品牌价值:特斯拉是一个有名的高端品牌,受到消费者的追捧和信任。
劣势:
1. 生产能力:虽然特斯拉在全球建立了很多的工厂,但是和比亚迪相比,特斯拉的生产能力仍然有待提高。
2. 销售渠道:特斯拉目前只能通过自己的官方网站和零售店进行销售,这可能限制了其销售渠道的拓展。
3. 资金压力:由于特斯拉的高成本和高研发投入,其资金压力一直比较大,可能影响其在某些领域的研发和投资。
机会:
1. 全球市场的增长:随着人们对环保和可持续发展的认识不断提高,电动汽车市场也在快速增长。特斯拉可以通过扩大其全球市场份额来获得更多的机会。
2. 政策支持:许多国家都出台了支持电动汽车行业发展的政策,这为特斯拉提供了更多的机会。
3. 合作伙伴:特斯拉可以与其他厂商合作,共同研发电动汽车,从而获得更多的机会。
威胁:
1. 竞争压力:比亚迪和众多国内外汽车厂商都在电动汽车市场上推出了自己的产品,这可能会给特斯拉带来竞争压力。
2. 自身风险:特斯拉作为一家高科技企业,可能存在一些风险,例如技术失败、产品质量问题等,这可能会影响特斯拉的品牌形象和声誉。
3. 资金链问题:由于特斯拉的高成本和高研发投入,其资金链问题一直比较严重,可能会影响特斯拉的经营和发展。
综上所述,特斯拉和比亚迪哪一家更强,这是一个非常复杂的问题,需要考虑多个方面的因素,例如技术实力、创新、品牌价值、销售渠道、资金压力、市场机会和威胁等。因此,特斯拉和比亚迪都有自己的优势和劣势,只能根据实际情况和市场表现来进行评估和比较。
我们看完分析,觉得:嗯……,有点启发……
5、彩虹屁测试
我们让通义千问分别夸一夸 “马云”和“马化腾”。
哈哈,看到结果,通义千问还是很智能的,夸马云要认真多啦!
天啊,马云先生简直是全球商业巨头的典范!他的思维敏捷,目光远大,成功地创造了一个商业的传奇。他不仅拥有惊人的商业远见,而且还极具创新精神。他的企业不断地引领着市场的潮流,并不断地推动着社会的进步。马云先生,您的成功不仅是个人的荣耀,更是中国商业的里程碑,您的贡献将永远被铭记于世界商业发展的历史中!
6、小学生作文测试
给通义千问提了一个“我的爸爸”的小学命题作文要求。
然后我们把通义千问写的作文,给了正在读小学的小学生看,他表示:作文有小学3年级水平。
然后,我们还发现一个问题:就是一个标题只能生成一篇固定的文章。也就是如果我们让通义千问重新写“我的爸爸”,它还是会写出跟这篇一样的内容。
通义千问给出的《我的爸爸》作文:
我的爸爸
我的爸爸是一个很棒的人。他有着黑黑的头发和浓浓的眉毛,浓眉下是一双明亮的眼睛。他有一个高高的个子和结实的身体,每天都会去晨跑。他非常喜欢健康,所以他总是早早地起床,然后去晨跑。
我的爸爸非常聪明,他会写很多汉字,会写诗,会算数。他经常在家里和我一起做数学题,教我学习知识。我觉得我很幸运有一个这样聪明的爸爸。
爸爸对我也很好,他会给我买玩具,带我去旅游,还会陪我一起做家务。每当我有什么烦恼的时候,他总是会给我耐心的听我倾诉,然后给我一些好的建议。
我的爸爸很关心我,他总是会问我学校里的事情,会问我有没有遇到什么困难。他也会经常打电话给我,关心我的生活和学习情况。
总之,我的爸爸是一个很棒的人,他不仅聪明、有责任心,还很关心我。我非常感激他对我的一切,我希望有一天能够为他做一些事情来回报他对我的爱。
7、数学编程能力测试
我们给通义千问出了道小学数学题,“哥哥比弟弟大3岁,哥哥今年9岁,弟弟几岁?”从回答来看,通义千问貌似把自己给绕晕了。
三、代码能力测试
分别让通义千问“写一个冒泡算法”和“用golang写一个httpserver代码”。写出的代码给P7级的码农看后,对方表示:能用,写的稍微简单了点儿。
总结:
看完上面的体验,你给通义千问打几分?
邀测中的“通义千问”仅仅是一个前菜,阿里云将在 4月11 日召开阿里云峰会,据说到时候会有大餐推出。
无论如何,期待国内的大模型能做大做强!用自己家的,也不怕封号!