OpenAI更新ChatGPT:支持图片和语音输入
IT之家 9 月 25 日消息,近日 OpenAI 宣布推出新版 ChatGPT,增加了两项新功能:语音输入和图像输入。据 OpenAI 称,新功能将在未来两周内向 ChatGPT Plus 订阅用户推出,其他人也将“很快”能够使用这些功能。
语音输入功能类似于手机上的语音助手,用户只需按下一个按钮,说出自己的问题,ChatGPT 就会将其转换为文本,然后生成答案,再将答案转换为语音,播放给用户。OpenAI 表示,这样的交互方式更加自然和便捷,而且由于 LLM 的技术优势,答案的质量也会更高。OpenAI 还开发了一种新的文本转语音模型,可以根据几秒钟的样本语音,生成与之相似的人声。用户可以从五种选项中选择 ChatGPT 的声音,而且这种模型还有更多的潜在用途。例如,OpenAI 正在与 Spotify 合作,将播客翻译成其他语言,同时保留播客主持人的声音。不过,这种模型也存在一些风险,比如可能被恶意利用来冒充公众人物或进行诈骗。因此,OpenAI 表示,这种模型不会被广泛开放,而是会受到严格的控制和限制。
图像输入功能则类似于 Google Lens,用户可以拍摄自己感兴趣的事物,并上传到 ChatGPT 中。ChatGPT 会尝试识别用户想要询问的内容,并给出相应的回答。用户还可以用应用中的绘图工具来帮助表达自己的问题,或者配合语音或文本输入来进行交流。ChatGPT 的优势在于它可以进行多轮对话,而不是一次性搜索。如果用户对答案不满意或想要更多信息,可以继续向 ChatGPT 提问,从而得到更准确和全面的答案。当然,图像搜索也有一些潜在问题。例如,在处理人物图片时,OpenAI 表示他们限制了 ChatGPT 对人物进行分析和直接评价的能力,既为了保证准确性,也为了保护隐私,这意味着上传一个人的照片就能知道他 / 她是谁还无法实现。
IT之家注意到,自从 2022 年初推出 ChatGPT 以来,OpenAI 一直在努力为其机器人增加更多功能和能力,同时避免造成新的问题出现。通过这次更新,该公司试图在这条界线上寻找平衡点,通过有意识地限制其新模型能做什么来实现这一目标。但是这种方法并不是长久之计,随着越来越多的人使用语音控制和图像搜索,以及 ChatGPT 逐渐成为一个真正的多模态、有用的虚拟助手,要保持安全和合理的边界会变得越来越困难。
百川智能发布基座大模型Baichuan 4,上线首款AI智能助手“百小应”5月22日消息,百川智能发布最新一代基座大模型Baichuan4,并针对C端用户推出成立之后的首款AI助手“百小应”,此外,百川智能还宣布针对B端用户和开发者开放Baichuan4、Baichuan3-Turbo、Baichuan3-Turbo-128k、Assi...
普通人在电脑上尝鲜AI技术的三种方式TechWeb文/新喀鸦随着科技的飞速发展,人工智能(AI)已经不再是遥不可及的未来科技,而是逐步融入我们生活的各个角落。从智能家居的便捷操控,到线上服务的智能推荐,再到医疗、教育等行业的深度应用,AI正以其独特...
消息称谷歌将推出明星网红AI聊天机器人,与Meta竞争6月25日消息,根据TheInformation爆料消息,谷歌正在基于明星和YouTube网红构建新的AI聊天机器人。这个想法并不是谷歌首创的,目前包括Character.ai这样的初创公司,以及像Meta这样的大公司已经推出了类似的产品。爆...
全球近半顶尖AI人才来自中国,如何才能发挥出优势5月24日消息,上周,关于“微软中国区Azure人工智能团队将集体打包去海外”的消息引起国内社交媒体上的热烈讨论。也是在上周,OpenAI发布能力最强大模型GPT-4o后,GPT-4o关键团队成员被扒出。17位团队成员中,有6人...
智谱AI CEO张鹏:将AI能力转化为生产力才有革命性意义6月5日消息,在智谱AIOpenDay上,智谱AICEO张鹏谈到AI时表示,对未来的想象力只有化为现实的生产力才具有真正的革命性的意义。张鹏表示:“今年年初的时候,我们提出2024年会是AGI元年的预判,于是有很多的朋友,不...
如何选购kawai电钢琴??2023年kawai选购攻略大全来了!
哈喽!最近有超多小伙伴问我:怎么选一台kawai性价比高的电钢琴?为了解决大家在选择kawai电钢的困惑,我专门...
苹果招募生成式AI人才 提供数十个大模型岗位
根据最新的招聘信息,苹果正在扩大其生成式人工智能领域的专业团队,并计划将这项技术应用于iPhone和iPad等...
软银正在开发日本版ChatGPT 计划明年推出
软银公司正在积极投入到AI相关技术的研发中,其CEO孙正义曾豪言,“如果不能拥抱AI便是失去未来”。目前,...
研究人员发布了针对ChatGPT和其他LLM的攻击算法
卡内基梅隆大学(CMU)的研究人员发表了LLMAttacks,这是一种用于构建针对各种大型语言模型(LLM)的对抗攻击...