作者|杨文
编辑|六耳
来源|创头条
大洋彼岸,大佬们还就“是否暂停AI大模型研发”争得面红耳赤。国内的大小厂却忙活得脚不沾地。
百度打了头阵,其他各家的AI大模型也都迫不及待交“答卷”。
创头条统计,4月8日至18日,这短短10天就有5场大模型发布会与众人见面。
4月8日,华为“盘古”大模型官宣。
4月10日,商汤“日日新”大模型面世。
4月11日,阿里“通义千问”大模型正式推出。
4月14日,同花顺AI产品发布会。
4月18日,阿里行业类模型发布会。
可谓是“你方唱罢我登场”,甚是热闹。
更有意思的是,为了在激烈的竞争中突出重围,开发者们引经据典,只为给自家的大模型取个响亮的名字。毕竟名字起得好,富贵跑不了。
-1-
说起来也奇怪,这批互联网大厂当年像商量好了一样,名字起得都相当接地气。要么是小米、苹果、搜狐等动植物齐上阵,要么就是滴滴、陌陌、探探等叠音型,再不就是360、58、51等数字型,总之,主打一个好记。
反观他们研发的大模型,那名字起得一个比一个拗口玄乎。百度“文心一言”、阿里“通义千问”、华为“盘古”、腾讯“混元”,甭管好不好记,气势先得出来,名字必须配得上“野心”。
论起名,阿里似乎颇有心得。
最为人津津乐道的就属阿里的“花名”。马云“风清扬”,张勇“逍遥子”,“东邪”“虚竹”“苗人凤”……大佬上班犹如武林开大会,大佬退休则为退隐江湖。
带有浓浓武侠风的阿里,这次却给自家的大模型起了个正经的名字“通义千问”。
“通义”取自《汉书》中的“天地之常经,古今之通义也”,有“普遍适用的道理与法则”之意。作为一个大型预训练语言模型,“通义千问”在训练过程中学习了大量的文本数据,从而具有广泛的知识和普适性,可以针对各种领域的问题“对答如流”。
而“千问”,阿里巴巴达摩院给出的官方解释是“千万次的问,千万的学问,能问出千问的一定是真爱,能回答千问的也一定是真有学问,以及AI和我们一样,都有千万次交互的热情”。
是否经得起“千万次的问”,该模型在内测中已然交了答卷。除了敲代码、算算术等常规操作外,“通义千问”还搞了一个针对不同场景的小应用集合“百宝袋”,可以写提纲,给出放飞的菜谱,甚至还生成彩虹屁。
百度的“文心一言”大有与阿里的“通义千问”一唱一和的架势。
马云痴迷武侠小说,李彦宏酷爱唐诗宋词。众所周知,“百度”这个名字就是取自辛弃疾的《青玉案》,“众里寻她千百度,蓦然回首,那人却在,灯火阑珊处”。
作为“全球首家发布类GPT产品的大厂”,在大模型起名上,百度煞费苦心。
据文心一言解释,“文”是语言文字,“心”是用心理解,“文心”从诞生之初就是致力于理解和运用语言文字的自然语言理解模型,同时也呼应《文心雕龙》,寓意用雕缕龙纹一样精细的功夫去研究语言文字的内涵和魅力。
“一言”既有“一言为定、一言九鼎”之寓意,也有人机之间“你一言我一语”自由流畅沟通之期盼。文心“一言”既出,即可“一生二、二生三、三生万言”。
只不过,百度发布会上“ Demo 演示”的形式不及预期,网友纷纷调侃应该改名为“一言难尽”。
-2-
网易在起名这事上向来佛系,只要不带“哥、爷、姐……”,昵称随便取,于是“富贵”“二狗”等名字成了网易打工人眼中的“香饽饽”。
自家人关起门来叫啥都行,但面向公众的大模型要是起个“土得掉渣”的名字实在说不过去。因此,网易一改以往的“土味”,给自家大模型取了个极文雅的名字——“玉言”。
“玉言”,取自“金口玉言”一词,即对别人所说话的敬称。
“玉言”大模型脱胎于网易伏羲,训练语料主要来自小说、百科和新闻等,模型规模从最早的一亿参数增长至千亿参数,模型领域也从文本拓展到图文、音乐、行为序列等多种模态,其具备的自然语言处理能力可应用于语言助手文本创作、新闻传媒、智能客服等领域,甚至在多项任务上超过人类水平。
此外,网易有道还将于近期推出教育场景下类ChatGPT模型——“子曰”。基于“子曰”研发的AI口语老师和中文作文批改DEMO已完成,近期开放内测。
“子曰”在古代是各家学生对老师的尊称,作为国内首个教育场景下的类ChatGPT模型,这个名字与其定位十分契合。
据悉,“子曰”类ChatGPT模型将尽快在网易有道建立起的“内容+硬件+AI”产业链条上实现商业化落地。
网易有“伏羲”,华为有“盘古”。
上周末,华为发布最新的盘古大模型。延续华为取名的霸气,此大模型的名字来自于“盘古开天”的神话,外界解读称这寓意着华为将通过输出技术能力与产业融合,使AI走向千行百业打开新空间。
事实也确实如此。
不同于“文心一言”等通用型大模型,华为“盘古”在消费端的应用并不惹眼,反倒是B端应用更惊艳。据华为介绍,华为更看重AI赋能产业,希望为煤矿、水泥、电力、金融、农业等行业创造更多产业价值。
-3-
取名同样“霸气侧漏”的还有腾讯。
与国际接轨的腾讯素有起英文名的传统,例如马化腾“Pony”、 刘炽平“Martin”。而此次腾讯AI大模型却从道家学说中“取经”——“混元即无极,无极生太极,太极生两仪,两仪生四象,四象生八卦,八卦衍万物”。
在这句经典的道家语录中,腾讯有了灵感,将机器学习平台命名为“太极”,基于此平台研发的AI大模型命名为“混元”。
腾讯的混元AI大模型包括计算机视觉、自然语言处理、多模态内容理解、文案生成、文生视频等多个方向,已广泛应用于腾讯微信搜索、腾讯广告等业务场景。
据总裁Martin所言,该大模型未来还会应用于各业务当中,除社交、通讯和游戏业务外,聊天机器人、数字助手、资讯获取等方面也将是腾讯的尝试方向。
作为人工智能领域的独角兽,商汤科技不负众望,已经成功研发了320亿参数量的全球最大的通用视觉模型。
3月中旬,商汤科技发布多模态多任务通用大模型“书生(INTERN)2.5”,不到一个月,又祭出“王炸”——日日新(SenseNova)大模型体系。
之所以命名为“书生”,一方面是因为研发团队的学院派背景,另一方面,书生作为中国古代读书人的经典形象,代表着一个通过不断学习、不断成长进而拥有各方面才能的人格化角色。
商汤将全新的通用视觉技术体系命名为“书生”,意在体现其如同书生一般的特质,可通过持续学习,举一反三,逐步实现通用视觉领域的融会贯通,最终实现灵活高效的模型部署。
如今,“书生2.5”已具备通用场景下图像描述、视觉问答、视觉推理和文字识别等感知和问题处理能力,在自动驾驶和居家机器人等场景下,可辅助处理各种复杂任务。未来的发展方向也将专注于通用模型的技术突破和创新应用。
而“日日新”,取自《礼记·大学》中“苟日新、日日新、又日新”,虽然目前“日日新”大模型仍集中在自然语言处理、图片生成、自动化数据标注、自定义模型训练等,但研发团队期望模型的迭代速度及处理问题的能力可以日日更新,不断解锁AGI更多可能。
此外,京东旗下言犀人工智能应用平台将推出ChatJD,定位为产业版ChatGPT,未来将聚焦零售和金融两块业务。
同样“不做通用大模型”的还有达观数据,其正在研发的“曹植”系统是一个专注于金融、政务、制造等垂直领域的大语言模型。
它的名称引自曹植“七步成诗”的典故,“我们想让大语言模型和曹植一样,才思敏捷,知识渊博,‘培养’出人工智能版的‘曹植’来”。
.END.
图片来源|摄图网
您也可以关注我们的官方微信公众号(ID:ctoutiao),给您更多好看的内容。