栏目分类

热点资讯

正规股票10倍配资

你的位置：国内炒股配资公司_炒股配资官网开户_正规股票10倍配资 > 正规股票10倍配资 >

Gemini上线第一天被质疑“造假”，谷歌这样回应

发布日期：2024-01-23 06:04 点击次数：155

和人类玩儿猜谜游戏,快速准确地识别视频中的动作并猜出电影来源，根据画面中的电吉他播放相应的音乐，不仅能识别手写物理题还能给出解题步骤……Google大模型Gemini上线时一段震撼业界的演示视频如今被质疑造假。

有人质疑，这段视频并非实时录制，而是多轮尝试并精心挑选和剪辑而成。根据 YouTube 上的视频描述，可以发现 Google 有一个重要的免责声明：“为了演示的目的，他们已经减少延迟，为了简洁，Gemini 的输出也缩短了。” 这意味着Gemini真实的响应时间要比视频中长。

第一财经记者留意到，Google官方后续发布了一篇名为《How it’s Made: Interacting with Gemini through multimodal prompting》的博客文章，列举了视频中演示的过程，可以看到的是，Gemini实现多模态交互需要经过多次提示和调试，并不仅仅是缩短了时间，而且Gemini所有的这些交互是通过提示词问出来的。也就是说，官方视频演示是使用了原始镜头中的静止图像帧，然后编写了文本提示，让 Gemini 进行回应。

例如，在官方演示视频中，一只手在镜头前做出变幻手势。Gemini 很快回应：“我知道你在做什么。你在玩石头、剪刀、布！”看起来，AI能够马上直接看懂人类的手势游戏。

但博客中这样描述了背后实现的过程：当“喂”给AI一张伸出手掌做出“布”的手势图时，Gemini的回答是：“这是一个人的右手，并且手指分开”。当它看到一张比划“剪刀”的手势图时，Gemini回答自己看到了一只伸出两个手指的手，通常是数字2的常用符号。当比划“石头”握紧拳头，Gemini认为是有人在敲门。最后，当“石头剪刀布”三张手势图放在一起，并且提示它“这是一个游戏后”，Gemini才终于答对。

再如，在逻辑推理相关的视频演示中，人类把画有太阳、土星和地球的图片展示给 Gemini，并问道：“这是正确的顺序吗？ Gemini马上纠正：“不，正确顺序是太阳、地球、土星。”

而实际上，这一视频背后的实现过程中，人类需要给出提示词：“考虑到与太阳的距离，这个顺序对吗？并解释你的理由。”此后，Gemini 才给出了正确回答。

但面对“造假”质疑，Google予以否认。记者留意到，Google DeepMind和深度学习副总裁、Gemini联合负责人奥里奥尔·维亚莱斯（Oriol Vinyals）发文表示：“该视频展示了使用Gemini构建的多模态用户体验，视频中使用Gemini Ultra的所有用户提示和输出都是真实的，为了简洁起见缩短了时间。”他还透露Google将在 12 月 13 日开放Gemini Pro的访问权限，届时开发者可以尝试类似的实践。

除了视频质疑之外，也有用户在使用中发现，在一些情况下，Gemini并没有正确反映真实的情况，例如，有用户测试后发现，对于2023年奥斯卡获奖者，Gemini Pro错误地表示最佳男主角是布兰登·格里森（Brendan Gleeson），而不是真正的得主布兰登·弗雷泽（Brendan Fraser）。而当被要求给出6个字母的法语单词时，Gemini Pro给出了错误答案。

此外，Google援引的MMLU测试表格显示，在Gemini Ultra 90.0%的分数下面标有CoT@32，也就是“使用了思维链提示技巧、尝试32次选最好样本”；而GPT4 86.4%分数下却是5-shot。测试还显示Gemini Ultra对于GPT4只有几个百分点的微弱优势，但GPT4的发布时间早于Gemini半年以上。

在使用行业标准5-shot MMLU的情况下，HuggingFace技术主管Philipp Schmid根据技术报告中的数据重新分析并得出结论：假设使用5-shot，Gemini的得分实为83.7%，而非90.0%；GPT4则取得86.4%的得分。

对于视频造假质疑，一位AI行业从业者对第一财经记者表示，尽管官方声称是为了简洁展现而缩短了时间，但从官方后续的博客描述来看，此前的演示视频确实存在一定的误导性，会让外界误认为Gemini的响应和交互速度、准确性如视频所演示的那样，但其实它并未展示出全部的真实。

也有投资人表示，这或许也反映出新一波AI浪潮之下Google的焦虑。此前凭借AlphaGo在围棋领域的表现，Google在全球掀起了一波AI浪潮。但这一轮AI新浪潮的风头却被OpenAI的ChatGPT抢走，Google需要一款现象级AI产品来证明自己在人工智能领域的实力。毕竟产品的真正实力不能只看宣传片，更重要的还是在实际应用中的比试，届时用户将“用脚投票”。

举报第一财经广告合作，请点击这里此内容为第一财经原创，著作权归第一财经所有。未经第一财经书面授权，不得以任何方式加以使用，包括转载、摘编、复制或建立镜像。第一财经保留追究侵权者法律责任的权利。如需获得授权请联系第一财经版权部：021-22002972或021-22002335；banquan@yicai.com。文章作者

刘佳

关键字

GoogleGeminiAI演示视频