训练数据
-
AI 与作者的版权之争:诉讼仅是开端,创意权益与技术创新的博弈才刚启幕
生成式 AI 的崛起彻底改变了数字内容创作格局,其凭借海量数据集(涵盖书籍、新闻、艺术品等各类创意作品)训练出具备类人创作能力的大语言模型(LLMs),让任何人都能快速生成文本、图…
-
人工智能的”锯齿状智能”现象:为何AI能解奥数难题却做不好小学数学
2025年,人工智能领域迎来一个耐人寻味的里程碑——谷歌DeepMind和OpenAI的系统在国际数学奥林匹克竞赛中斩获金牌,这些AI模型解决的难题全球仅有少数顶尖青年数学家能够攻…
-
Scale AI起诉前员工及竞争对手Mercor:AI数据标注行业爆发商业间谍案
在人工智能行业竞争白热化的背景下,数据标注领域的龙头企业Scale AI近日向加州北区联邦法院提起诉讼,指控其前高管Eugene Ling及竞争对手Mercor公司涉嫌商业间谍活动…
-
美国参议员提出RISE法案:要求AI开发者公布训练数据及评估方法以换取免受诉讼的“安全港”
在人工智能(AI)技术日新月异的今天,美国国会的一些议员正着手推动新的法规,旨在通过立法为这一行业提供稳定的框架。其中,由美国怀俄明州共和党参议员辛西娅·卢米斯提出的《2025年负…
-
字节跳动发布Seed-Thinking-v1.5,进军推理AI领域
在AI技术日新月异的今天,各大科技巨头纷纷在推理AI领域展开激烈角逐。近日,字节跳动,这家以TikTok闻名的中国互联网巨头,也正式宣布推出其最新的大型语言模型——Seed-Thi…
-
DeepCoder-14B:以高效140亿参数模型展现顶级编码性能
在AI领域,一款新的编码模型正崭露头角,它就是DeepCoder-14B。这款模型由Together AI和Agentica的研究人员共同推出,其性能表现令人瞩目,与OpenAI的…
-
Hugging Face扩展LeRobot平台,引入自动驾驶机器训练数据
Hugging Face近日宣布对其LeRobot平台进行重大扩展,新增了针对自动驾驶机器的训练数据。这一举措旨在提升自动驾驶技术的准确性和可靠性,通过引入高质量的训练数据,助力自…
-
数千名创意人员签署请愿书,反对人工智能数据抓取
演员凯文·贝肯、小说家石黑一雄、音乐家罗伯特·史密斯、记者兼历史学家西德尼·布卢门撒尔有什么共同点?他们都是 11,500 名签署请愿书的人之一,反对未经许可使用创意作品进行人工智…
-
Kimi创始人杨植麟最新分享:关于OpenAI o1新范式的深度思考
OpenAI o1的发布,又一次引发了行业内关于大模型进化新范式的讨论。 讨论的焦点是两个公认的大模型进化瓶颈:数据瓶颈——数据不够用了;以及算力瓶颈——3.2万张卡已是目前的天花…
-
Pixtral 12B 现已上市:Mistral 的新型多模态 AI 可以无限制地分析图像
Mistral AI 终于进军多模态领域。今天,这家法国 AI 初创公司与 OpenAI 和 Anthropic 等公司展开竞争,发布了 Pixtral 12B,这是其首款同时具备…