1. OpenAI推出全新语音转录模型gpt-4o-transcribe,该模型在语音转录领域表现出色,错误率显著降低,尤其在英语转录中达到了2.46%,支持多种复杂环境下的转录,并具备噪声消除和语义语音活动检测等技术。

2. 快手搜索AI升级,全面接入DeepSeek R1大模型,显著提升搜索效果和用户体验,同时AI内容创作平台“可灵AI”在视频和图片生成领域变得更加高效。

3. Claude推出网络搜索功能,提供实时信息与来源引用,将在线搜索结果转化为对话式回答,并精确标注信息来源。

4. 字节跳动推出推文生图框架InfiniteYou,根据用户文字描述生成个性化图像,保留用户身份特征的同时,灵活变换场景与内容。

5. 腾讯元宝新功能支持分析复杂Excel表格,用户用自然语言提问,元宝便能快速读取数据并进行计算,简化操作流程。

6. Krea AI发布“Video Training”功能,允许用户通过上传个人图像和视频素材训练专属的AI视频风格模型,提升内容创作的个性化和灵活性。

7. DomoAI推出语音图像生成数字人功能,用户通过上传语音和图像生成会说话的虚拟人物,支持多种时长选择,提升创作灵活性和效率。

8. Sider AI推出Deep Research功能,能自动模拟人类研究行为,生成可视化交互式报告,提升研究效率。

9. 高中生利用《我的世界》搭建AI模型评测网站,通过投票评估AI模型的表现,提高公众参与度。

10. Reka AI开源Reka Flash3模型,拥有210亿参数,具备强大的推理能力,支持低延迟和设备友好的部署。

11. 生数科技Vidu获得7部千万级网文IP概念短片改编授权,AI技术提升制作效率,缩短制作周期。

12. 全球首个儿科大模型“福棠・百川”问世,助力儿童医疗服务升级,提供科学、个性化的诊疗方案。

  1. 转载请保留原文链接谢谢!
  2. 本站所有资源文章出自互联网收集整理,本站不参与制作,如果侵犯了您的合法权益,请联系本站我们会及时删除。
  3. 本站发布资源来源于互联网,可能存在水印或者引流等信息,请用户擦亮眼睛自行鉴别,做一个有主见和判断力的用户。
  4. 本站资源仅供研究、学习交流之用,若使用商业用途,请购买正版授权,否则产生的一切后果将由下载用户自行承担。
  5. 联系方式:936787576@qq.com