gpt-4o - 搜索 News

资讯

红板报 on MSN2 天

GPT-4o图像生成架构被“破解”了？自回归主干+扩散解码器，还有4o ...

GPT-ImgEval团队投稿量子位 | 公众号 QbitAI GPT-4o图像生成架构被“破解”了！最近一阵，“万物皆可吉卜力”让GPT-4o的图像生成功能一炮而红，人们随之好奇： ...

人人都是产品经理 on MSN9 小时

GPT-4o生图8种王炸用法提效神器

在 AI 绘画领域，GPT-4o 正在掀起一场革命！它不仅让小白秒变设计高手，还为创意工作者提供了强大的生产力工具。本文将为你揭秘 GPT-4o 在生成图片方面的八大“王炸”用法，涵盖从海报设计、四格漫画到电商换装、室内设计、IP ...

11 天

扒开GPT-4o生图真相！港中文博士生「破解」OpenAI隐藏秘密，还能手动 ...

就在刚刚，港中文的一位博士生Jie Liu破解了GPT-4o不一般的前端生图秘密：实际上，它很大可能是原生自回归（AR）生成的，甚至我们可以手动改图。无独有偶，CMU博士Sangyun Lee也推测出，GPT-4o的图像生成原理，应该大致如下： ...

11 天

GPT-4o图像生成的秘密，OpenAI 没说，网友已经拼出真相？

很多网友猜想 GPT-4o 的图像生成采用了「自回归 + 扩散」的范式。比如 CMU 博士生 Sangyun Lee 在该功能发布后不久就发推猜想 GPT-4o 会先生成视觉 token，再由扩散模型将其解码到像素空间。而且他认为，GPT-4o ...

3 天

这些职业正在被摧毁：实测10个GPT-4o绘图最火的案例

鲸哥也用4o生成了自己的头像，大家看看是不是还挺好玩。要知道此前AI头像生成是小红薯上非常赚钱的副业赛道。现在门槛被打没了，你只需要一句话就可以生成（记得这是3D迪士尼风格即可）。

格隆汇 on MSN2 小时

剑指GPT-4o，HiDream-I1开源24小时内登顶全球知名竞技场榜单

剑指GPT-4o，HiDream-I1开源24小时内登顶全球知名竞技场榜单,gpt-4,竞技场,hidream ...

5 天

解构多模态，GPT-4o 的自回归路线真的走通了吗？

3. 同样，针对于 GPT-4o 的图像生成功能的技术细节，在社交平台上出现了诸多的猜测，例如推测采用了「自回归生成」的技术路径等。也有文章指出，GPT-4o 的图像生成能力大幅提升的关键在于提升了」文本-图像」模态对齐的能力。 [1-2] ...

on.cc东网12 小时

商汤：SenseNova V6能解决复杂任务数据分析力大胜GPT-4o

内地人工智能 (AI)巨头商汤 ( 00020 )昨日于上海举行技术交流日活动，会上发布新一代多模态融合大模型“日日新SenseNova ...

虎嗅网13 天

GPT-4o的P图太火了，GPU在融化，官方终于限流了

“看到人们喜欢 ChatGPT 中的图片功能真是太有趣了，但是我们的 GPU 正在融化。” 上线不到 72 小时，OpenAI 的 GPT-4o 原生图像功能终于扛不住了。今天凌晨，OpenAI CEO 山姆・奥特曼在社交平台 X 上宣布 ...

2 天on MSN

亚马逊推出AI语音模型Nova Sonic：价格比GPT-4o便宜80%

Nova Sonic通过亚马逊Bedrock开发者平台提供服务，采用创新的双向流式API接口，为企业级AI应用开发提供了强大支持。

1 天

亚马逊发布Nova Sonic AI语音模型，价格比GPT-4o便宜80%

在LibriSpeech基准测试中，Nova Sonic的英语、法语、意大利语、德语和西班牙语的单词错误率低至仅4.2%，大幅优于业界标准。尤其是在噪声环境及高音量的多人互动场合，Nova Sonic相较于OpenAI的GPT-4o-转录模型，单词错误率降低了46.7%，显示出其强大的语音识别能力。此外，其平均响应速度仅为1.09秒，较其竞争对手快出0.09秒。

当前正在显示可能无法访问的结果。

隐藏无法访问的结果