
在人工智能领域,数据访问的重要性日益凸显。Bright Data,这家以色列的网页抓取公司,不仅在法庭上击败了Meta和埃隆·马斯克的X公司,如今更凭借其1亿美元的AI平台,向科技巨头们发起了挑战。这家曾专注于网页抓取服务的公司,如今已转型为AI公司所需的“独特基础设施层”。
法庭胜利奠定法律基础
2024年,Bright Data在联邦法庭上取得了对Meta和X公司的高调法律胜利。法官们驳回了这两家公司对其非法抓取平台的指控,确立了关于互联网上“公共数据”的重要法律先例。这些数据是指无需登录即可查看,并可合法收集和使用的信息。这些裁决不仅为Bright Data的业务扫清了障碍,更对整个AI行业产生了深远影响,因为该行业高度依赖网页数据来训练和运行语言模型。
Deep Lookup与Browser.ai:解锁AI数据访问
基于法庭上的胜利,Bright Data推出了Deep Lookup、Browser.ai以及增强的数据收集协议,旨在为人工智能系统提供对实时网页数据的无限制访问。CEO奥尔·伦克纳表示,如今限制LLM(大型语言模型)智能的不再是算法本身,而是数据访问。Deep Lookup作为一款自然语言研究引擎,能够实时回答复杂、多层次的商业问题,而Browser.ai则被誉为“行业首款无法阻挡的AI原生浏览器”,专为自主AI代理设计,能够模拟人类行为访问网站,执行复杂的网络交互,如预订航班或餐厅。
挑战科技巨头的数据垄断
随着AI公司越来越难以获取运行聊天机器人、自主代理等AI应用所需的当前网页信息,Bright Data的新产品恰逢其时。伦克纳指出,Big Tech平台正试图垄断这些数据,而Bright Data正致力于打破这种垄断。他强调,尽管与X公司的反垄断诉讼已和解,但Bright Data从未放弃其基本信念,即公共数据应对公众开放。
Bright Data的竞争优势在于其克服网站阻断机制的“痴迷”。公司拥有超过5500项专利,运营着全球最大的代理网络,覆盖195个国家的1.5亿多个IP地址。这种强大的技术基础使得网站难以检测和阻止其访问。伦克纳表示,除非网站将数据置于登录后访问,否则几乎无法阻挡Bright Data。
自ChatGPT推出以来,Bright Data经历了爆炸性增长,其年度经常性收入几年前就已超过1亿美元。公司服务于超过2万家企业,包括财富500强公司和主要AI实验室。同时,Bright Data在合规性方面投入巨大,遵守欧洲GDPR和加州CCPA等隐私法规,自动通知个人其个人信息被收集,并提供删除选项。
数据访问战争的加剧
随着AI系统的日益复杂,对当前、全面的网页数据的访问变得越来越有价值,也越来越具有争议性。伦克纳预测,互联网将变得越来越“封闭”,少数科技巨头将能够自由访问所有网站,而其他人则必须使用Bright Data或类似的基础设施。这种趋势反映了AI行业在信息控制和竞争优势方面的更广泛紧张局势。
从网页抓取到AI基础设施的转型
Bright Data的转型反映了AI行业快速演变的需求。随着公司竞相部署AI代理和自主系统,对实时网页数据的访问变得与计算能力和算法复杂性同样重要。Bright Data的法律胜利和技术创新可能共同塑造整个AI行业如何访问和使用网页信息,而像Bright Data这样的独立基础设施提供商可能成为维持AI生态系统竞争平衡的关键。
原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/bright-data-zhan-sheng-ai-long-ma-si-ke-yu-meta-qi-1-yi-mei