语音识别
-
Mistral发布首个开源AI音频模型Voxtral,开启多模态AI新纪元
法国人工智能初创公司Mistral AI于7月15日正式推出其首款开源音频处理模型Voxtral,标志着这家以大型语言模型闻名的公司正式进军多模态AI领域。这款基于Transfor…
-
Wispr Flow获3000万美元融资,Menlo Ventures领投打造AI语音输入新纪元
在人工智能(AI)技术日新月异的今天,一款旨在革新语音输入体验的应用——Wispr Flow,宣布成功完成了3000万美元的Series A轮融资。本轮融资由知名风投机构Menlo…
-
Yelp引入AI语音助手,革新餐饮与服务体验
在数字化转型的浪潮中,Yelp,这一全球知名的本地生活服务平台,近日宣布了一项重大更新:将AI语音助手引入其平台,旨在为餐饮与服务业提供更加智能、便捷的交互体验。这一创新举措不仅展…
-
Amazon推出Nova Sonic,革新实时语音交互体验
Amazon,这家以电子商务巨头身份闻名于世的公司,近年来在人工智能领域也屡有建树。其Alexa AI语音助手产品更是家喻户晓,而近期,Amazon又为Alexa带来了一位新成员—…
-
网站无障碍性现状堪忧:监管加强下多数网站仍未达标
在当今这个数字化时代,互联网已经成为人们获取信息、交流互动和进行交易的关键平台。然而,随着各国政府对数字无障碍性的关注度日益提升,一系列旨在保障残障人士等特殊群体网络权益的法规相继…
-
Zoom的AI进化:从基础会议工具到由LLMs和SLMs驱动的代理型生产力平台
在数字化时代,视频会议软件Zoom已经成为企业沟通与合作不可或缺的一部分。然而,Zoom的旅程远未止步于简单的视频通话。近年来,通过深度集成人工智能技术,Zoom已经从一个基础会议…
-
苹果智能家居中心因Siri挑战而推迟发布
据最新报道,苹果公司的智能家居中心产品发布计划遭遇挫折,原因竟出自其内置的Siri语音助手。这款备受期待的智能家居中心原本被视为苹果在智能家居领域的一大突破,但如今却面临延期发布的…
-
Meta下一代LLAMA模型或将升级语音功能
近日,科技巨头Meta在人工智能领域再传新动向。据悉,Meta正在研发的下一代LLAMA(Large Language Model Family of AI Algorithms)…
-
谷歌Gemini:现在您可以从iPhone锁屏与之对话
谷歌近日宣布了一项令人兴奋的新功能——用户现在可以直接从iPhone的锁屏界面与谷歌Gemini进行语音交互。这一创新功能极大地提升了用户与智能助手的互动体验,使得信息获取和服务调…
-
苹果或将在2027年推出真正现代化的Siri
近年来,随着人工智能技术的迅猛发展,智能语音助手已成为众多科技巨头竞相布局的关键领域。然而,在这一激烈竞争中,苹果公司的Siri似乎显得有些力不从心。据最新消息透露,苹果可能要到2…