训练数据

AI前沿

数据标注：打造精准机器学习模型的核心基石

在人工智能技术飞速发展的今天，机器学习模型凭借强大的智能表现赢得了广泛赞誉，但其背后的成功密码却常常被忽视：数据标注。作为机器学习流程中的基础环节，数据标注的质量直接决定了模型的最…

王浩然
2026年2月27日
000
AI前沿

AI 与作者的版权之争：诉讼仅是开端，创意权益与技术创新的博弈才刚启幕

生成式 AI 的崛起彻底改变了数字内容创作格局，其凭借海量数据集（涵盖书籍、新闻、艺术品等各类创意作品）训练出具备类人创作能力的大语言模型（LLMs），让任何人都能快速生成文本、图…

王浩然
2025年11月19日
000
AI前沿

人工智能的”锯齿状智能”现象：为何AI能解奥数难题却做不好小学数学‌

2025年，人工智能领域迎来一个耐人寻味的里程碑——谷歌DeepMind和OpenAI的系统在国际数学奥林匹克竞赛中斩获金牌，这些AI模型解决的难题全球仅有少数顶尖青年数学家能够攻…

王浩然
2025年9月30日
000
AI前沿

Scale AI起诉前员工及竞争对手Mercor：AI数据标注行业爆发商业间谍案‌

在人工智能行业竞争白热化的背景下，数据标注领域的龙头企业Scale AI近日向加州北区联邦法院提起诉讼，指控其前高管Eugene Ling及竞争对手Mercor公司涉嫌商业间谍活动…

王浩然
2025年9月5日
000
AI前沿

美国参议员提出RISE法案：要求AI开发者公布训练数据及评估方法以换取免受诉讼的“安全港”‌

在人工智能（AI）技术日新月异的今天，美国国会的一些议员正着手推动新的法规，旨在通过立法为这一行业提供稳定的框架。其中，由美国怀俄明州共和党参议员辛西娅·卢米斯提出的《2025年负…

王浩然
2025年6月15日
000
AI前沿

字节跳动发布Seed-Thinking-v1.5，进军推理AI领域

在AI技术日新月异的今天，各大科技巨头纷纷在推理AI领域展开激烈角逐。近日，字节跳动，这家以TikTok闻名的中国互联网巨头，也正式宣布推出其最新的大型语言模型——Seed-Thi…

王浩然
2025年4月12日
000
AI前沿

DeepCoder-14B：以高效140亿参数模型展现顶级编码性能

在AI领域，一款新的编码模型正崭露头角，它就是DeepCoder-14B。这款模型由Together AI和Agentica的研究人员共同推出，其性能表现令人瞩目，与OpenAI的…

王浩然
2025年4月12日
000
AI前沿

Hugging Face扩展LeRobot平台，引入自动驾驶机器训练数据‌

Hugging Face近日宣布对其LeRobot平台进行重大扩展，新增了针对自动驾驶机器的训练数据。这一举措旨在提升自动驾驶技术的准确性和可靠性，通过引入高质量的训练数据，助力自…

王浩然
2025年3月12日
000
AI前沿

数千名创意人员签署请愿书，反对人工智能数据抓取

演员凯文·贝肯、小说家石黑一雄、音乐家罗伯特·史密斯、记者兼历史学家西德尼·布卢门撒尔有什么共同点？他们都是 11,500 名签署请愿书的人之一，反对未经许可使用创意作品进行人工智…

王浩然
2024年10月24日
000
AI前沿

Kimi创始人杨植麟最新分享：关于OpenAI o1新范式的深度思考

OpenAI o1的发布，又一次引发了行业内关于大模型进化新范式的讨论。讨论的焦点是两个公认的大模型进化瓶颈：数据瓶颈——数据不够用了；以及算力瓶颈——3.2万张卡已是目前的天花…

点点
2024年9月16日
000

1 / 2
1
2
下一页