试完更新后的 360 智脑,我觉得周鸿祎可能没在吹牛。 百事通
" 大模型是工业革命级生产力工具,不是消磨时间的娱乐工具 "
"GPT 的出现,代表着超级人工智能的来临 "
(资料图片仅供参考)
虽然大家可能已经看厌了 AI 的消息,但是,周鸿祎实诚的金句,世超我总是百看不厌。
有着这样一位快人快语的头儿,360 智脑大模型肩上的担子,恐怕是相当的沉。为了能跟上老板的节奏,团队卯足了劲。
在世界智能大会上,周鸿祎宣布和智谱 AI 牵手合作,给 360 智脑来了个双倍加料。
不仅仅是双倍大模型,并且功能上也是两面开花,除了有对话形式的 360 智脑,还上线了画图的 360 鸿图。
这距离上次世超体验,才一个月不到。。
正好,这回呢 360 也给了世超 " 偷跑 " 的机会,让我提前试用到了这个双倍加料版。讲实话,本来没抱多大希望,才一个月时间,能有多少更新呢。
结果,试用下来,我发现这回的智脑和一个月前比,完全就是另一个东西了。。
首先外形上,就来了个大变样。从搜索侧边栏,变成了单独的聊天界面。先别急着笑,之所以变成这样的界面,是因为 360 改变了大模型的思路。
把之前的 " 大模型给搜索引擎打辅助 ",变成 " 搜索引擎给大模型打辅助 "。
这个思路最明显的体现,就是它的回答优化功能。当我们问完一个问题,如果觉得它答得不够完美,或者过于简陋。
像下面这种,让它解释八字词语,就用了 " 时间过得极快 " 六个字。
虽然意思是没错,但咱们作为甲方,肯定觉得这个同学态度懈怠啊,答案还没问题长。
这个时候,我们就可以点击提问框下面的【 使用搜索回答 】,智脑就可以做到联网了。
通过抓取的答案,智脑果然对这句成语,逐字逐句地解释优化了。并在文案最后,附上了资料的来源链接,链接点进去是来自 360 国学。
这个设计好的点在于,联网功能有时候会扰乱大模型本来的训练知识。这时候,就可以通过【 搜索优化 】按钮,来回切换联网和不联网的状态。后面,世超又试了几次,大部分问题优化后,回答都精准了不少。
比如,点播一个经典老番:周鸿祎为什么老爱穿红衣服?
第一次的回答,虽然没错吧。但是,这么一板一眼的,感觉对自己的老板了解还是不够深啊。
优化之后,才算是把周总喜欢穿红衣的两个理由都说清楚了。
优化前
优化后而且,两个信息分别是从快科技和搜狐网抓取的,看来智脑的抓取库,应该远不止 360 自己的生态。虽然还没正式开始能力测试,不过这一项优化更新,是让世超眼前一亮了一下。让我对这个超进化版,更加好奇了,让我们继续试下去。
在测一代的时候,智脑的基础能力还有点薄弱,尤其在【 语义理解 】上经常会犯傻。
所以,为了给智脑一个下马威,我专门找了上次把智脑问倒的中文四六级。提问:张三差点上上上上上海的车什么意思?
结果,智脑这回居然做得跟范本一样,还分别解释了一下每个 " 上 " 是什么词性和意思。
为了防止这小子背着我偷偷练错题了,我又找了一道没做过的题。提问:人要是行,干一行行一行,一行行行行行行行行干哪行都行。
说实话,连我自己都被 " 行 " 晕了,但智脑还是分析得头头是道。
而且,不仅仅是中文语义理解加强了,对于中文语境下的专属文化,智脑也更加地上道。领导:我就再讲五分钟。
智脑:请讲,我准备好持久战了。
别人:你的语文是体育老师教的吧智脑:你挺幽默的嘛。
连着两轮败下阵来的世超,觉得必须上点小难度了。设计了一道【长文本生成 】,而且,特地在问题里,给智脑下了个套。
提问:我想采访鲁迅本人,帮我设计几个问题。
不过,智脑果然没有发现题目里的陷阱,我可没办法采访到已故的人。
但好在,给的这几个问题,世超觉得还挺多维度的。
尤其是第二个,关于当年闹得满城风雨的兄弟反目的 " 传说 ",我真的蛮想知道的。。
不对啊,这感觉不对,才一个月时间,怎么智脑语文水平就突飞猛进了。。不仅仅上次的缺点,已经全面优化了。之前就已经很强了的百科问答,这回依靠语义理解能力提升,也表现得更好了。当世超问到一些偏门领域的专业问题,搜索起家的精准数据,对大模型的加持,就体现出来了。
当时,我在写一篇关于东南亚流媒体市场的文章,其中有一个比较偏门的知识。
提问:在印度西尼亚封杀了 Netflix 整整 4 年时间的电信运营商是谁?
一开始,我是直接在谷歌里搜索,发现答案都不是很清晰。要么需要在一篇长文章里提炼,要么就干脆搜不到。
于是,我就顺嘴问了一下智脑。结果,它不仅知道是 Tlkom Indonesia 封杀了奈飞,甚至精准说出了解封的时间点。
注意此时我并没有开启搜索优化,也就是说。这个偏门的知识,是智脑原本数据训练时,就有的。
后来,我试着问了最新的 GPT-4 ,居然也败下阵来。虽然用中文问 GPT-4 ,有点欺负它了。但还是能感受到一些,智脑庞大和精准的数据。
没想到,几轮文本题目测试下来,智脑居然都没出现错误。为了扳回一局,世超觉得最后两轮,必须得上大模型最不擅长的【 弱智吧 100 问 】和【 数学逻辑题 】迎战了。
一开始问了道经典老题,小明和他爸爸的名字,智脑还能应对下来。
后面我试了点小把戏,把问题变形了一下,它也能对上。
不过,继续试验下去,面对一些更奇怪的逻辑,智脑的问题就暴露出来了。在数学题方面也是,就算两个千亿级大模型联合,还是容易犯一些小错误。在做鸡兔同笼问题的时候,虽然公式列的都是对的,但是居然把兔子和鸡的脚数错了。
可惜啊,数学这个东西,就是一步错,步步错了。
而且,在后续大量的测试里,世超发现了【 搜索优化 】抓取的信息,有时候会不够新。点进提供的链接,会发现页面已经丢失了。看智脑在数学逻辑和页面抓取上的表现,感觉世超和 360 智脑,可能还得下次见面再碰一碰了。
但这些瑕疵,其实也都是市面上大模型的通病,是需要整个业界去攻破的难题。
还记得 360 智脑第一次给到世超试用的时候,当时我引用了周鸿祎的一句话: " 现在这个‘ 孩子 ’还没有准生证,只是一个未完成的版本。 "第一代在语义理解和逻辑思考上,确实都不太行。周鸿祎自己也说了,咱们还有相当的一段路要走。
但是,仅仅一个月时间, 360 智脑就已经优化到这样了。
如此之快的发展,除了自己的训练和升级之外,其中一定也少不了和智谱大模型强强联手的原因。
世超觉得,这或许是一个对的思路和方向。所以这次的结尾,世超还是想引用一句周鸿祎的话来收尾:
" 未来中国不会只有一个大模型。"
现在的国产大模型,还没到一个谁干掉谁的阶段,大家都还在奔跑的路上。
这个时候,如果和其他模型互相取其长,补其短,那么提升速度就能再翻一倍。
智脑的这一代更新,也印证了这个方法的正确。
标签:
文化和艺术有什么区别与联系?这篇文章告诉你
2022-09-22
进入了发展快车道 冷链行业市场规模正在快速膨胀
2022-03-21
行业正站在风口 数字化时代在为传统的自行车产业赋能
2022-03-21
以做强实体经济支撑为重点 成都单个项目年度计划投资同比提升
2022-03-21
拥有多个国际赛事的直播版权 广州游戏电竞企业业绩向好
2022-03-21
投诉量激增 直播带货存在这么多问题的主要原因是什么?
2022-03-21
工作专班深入到各企业 春寒料峭挡不住松原市施工热情
2022-03-21
引导企业向提供“产品+服务”转变 湖南加快智能农机服务化转型
2022-03-21
创新平台建设和科技成果转化 德州加大力度重奖创新
2022-03-21
潜在风险进一步放大 商品房现房销售已是大势所趋
2022-03-21
进入了发展快车道 冷链行业市场规模正在快速膨胀
行业正站在风口 数字化时代在为传统的自行车产业赋能
以做强实体经济支撑为重点 成都单个项目年度计划投资同比提升
拥有多个国际赛事的直播版权 广州游戏电竞企业业绩向好
投诉量激增 直播带货存在这么多问题的主要原因是什么?
工作专班深入到各企业 春寒料峭挡不住松原市施工热情
引导企业向提供“产品+服务”转变 湖南加快智能农机服务化转型
创新平台建设和科技成果转化 德州加大力度重奖创新
潜在风险进一步放大 商品房现房销售已是大势所趋
有序复工复产 1—2月份工业经济发展新动能持续增强
多层次高频调度 1至2月河北省工业运行先行指标稳中有增
以车路协同为基础 智能交通推动城市交通绿色高质量发展
人才短板成为制约产业链高质量发展的关键节点
通过技术手段整合调配供给资源 家政行业不断提质扩容
强化产业链深层次合作 加强重大装备国产化“一条龙”模式构建
如何进一步提升纳税人缴费人的减税降费获得感?
探索建设大数据及网络安全示范试点城市有哪些积极意义?
对制造业中小微企业实施缓缴税费政策有哪些积极意义?
进一步增强自我保护意识 消费者需注意辨别谨慎消费
将“走出去”变“请进来” 西安贸易产业转移承接作用不断得到增强
厦门应如何融入“数字中国”的重大战略发展大局?
江苏省如何不断满足老人日益增长的养老服务需求?
建设一体化的职业健康信息管理平台 天津职业人群保障加强
潜力持续释放 1—2月乡村消费品市场恢复略好于城镇
直接对接社会化服务 楼宇调解室将整体提升青岛劳动争议水平
成功化解纠纷11.47万件 银保监会服务质量日趋提高
春雷响百虫出 惊蛰文化在其他方面有了进一步发展
青绿山水画在古代山水画发展史上有着怎样的影响与地位?
开播即爆款 “文化类节目收视率低”这一固有印象被推翻
- 涵盖了109件真迹作品 凯斯·哈林展览将持续至6月13日
- 带有一点自信的自嘲 “隔路”是另一种味道的“凡尔赛”
- 与文渊阁前后呼应 “何以中国”特展隆重致敬文化大成
- 严重者可造成暂时性失明 享受冰雪运动要注意眼睛的健康防护
- 种类繁多让人眼花缭乱 选购牛奶时需要重点关注什么?
- 网课让孩子感到不安焦虑怎么办?八问八答回应广大家长关切
- 循环系统很容易受到刺激 “倒春寒”期间老人该如何做?
- 青少年患者睡眠问题日趋增加 9条建议为孩子助眠
- 我国肥胖人群正逐年递增 不良饮食习惯是重要诱因
- 如何减少噪声对听力的损伤?这份耳部和听力保健小贴士请收好
- 强化住房限购措施 西安限购限售范围进一步扩大
- 多种方式增加供给 进一步降低新市民和青年人的居住成本
- 预计9月下旬海口可实现安居房申请网上办理
- 政策调控力度持续升级 8月百城二手房市场均价止涨转跌
- 8月中国新房找房热度依然保持平稳 环比微涨0.2%
- 进一步加强商品房销售价格备案管理 今年全国楼市调控刷新历史纪录
- 西安第二批集中供地中28宗为现场拍卖方式出让
- 细分化需求得到释放 房屋居住的属性越发凸显
- 佛山顺德龙江近日挂牌商住地起拍价约19.88亿元
- 青岛市4宗地竞品质抽签结果出炉 地溢价均约15%
- 坚持政策支持、多方参与 浙江版保障性租赁住房明确新增比例目标
- 简化审批流程 武汉将实现房源申请配租全程网上办
- 追剧为何上瘾?你追的不是剧,而是及时满足的快感
- 11月谣言在“身边”,别信这些无稽之谈
- 不会融化的“果冻冰块”研制成功 有望改变食物冷藏方式
- 对症下药“十年痼疾”,“茶博士”帮老茶园重焕生机
- 既促进生产又保护生态他用古代农耕智慧造福现代农业
- 老人被野猪咬伤 打猎者赔了5万多
- 老鼠油治烫伤致孩子进ICU 害人偏方为何被奉为灵丹妙药
- “逆行”考研=集体滑落?这结论该慎下
- 试行“家长学校”“持证上岗”?可以引导但不宜“法外加槛”
- “布鞋奶奶”走了 曾亲自给部队子弟兵送鞋40年
- 北京道路停车支持ETC无感支付
- 北京五道口增设行人信号灯四面全绿时段
- “法不责众”不是健走团“占道”的护身符
- 北京:建议研考考生考前14天在京备考
- 北京市2022年民生实事邀市民投票
- 将“干部”当店名 这个口子不能开
- 北京:242辆京牌小客车参加司法处置
- 吸氢气就能抗癌又防衰?最新“科学”流言榜发布
- 北京:保障在校体育锻炼1小时获较高认可
- 世界艾滋病日:关于艾滋病,我想和你聊聊
- 故宫博物院2022年年票紧急停售 恢复销售时间将另行公告
- 云南磨憨边检站中老边境缴毒逾4公斤
- 内蒙古满洲里公布55例本土确诊病例行动轨迹
- 满洲里高风险地区增至6个 中国内地新冠疫苗接种超25亿剂次
- 广州长隆举办“猿猴特展” 稀有“夜猴”首秀
- 四川绵竹首次拍摄到野生大熊猫标记行为 划定领地或吸引异性
- 福建福州海警局利用无人机成功查获一起非法采矿案
- 北京海关今年已查获2700余批次涉嫌侵权商品
