2024年6月24晚至今,大量用户收到来自OpenAI的邮件,通知将于7月9号起阻止来自非支持国家和地区的流量。会影响到大部分国内的个人开发者和套壳软件。同时有很多人说会利好国内大语言模型的发展,基于此,我想来聊聊我对此事的看法以及系统特性更新与AI进化的关系。
我也注册了OpenAI的开发者,在使用他家的api服务,但目前还未收到通知邮件,就从网上截取的相关图片:
英文原版 | 中文翻译版 |
---|---|
自OpenAI的chatgpt上线以来,chatgpt-demo与gptAPI服务从未将中国列入支持范围(或许并非人家不想)。但国内的企业和个人开发者都可以通过代理或其他途径使用到gpt的服务,对于C端更是催生出一大片的套壳应用,对此OpenAI也是睁一只眼、闭一只眼,并没有进行管控。
邮件内告知,从24年7月9号开始,阻止非支持国家和地区的流量,自然中国包含在内,引起网上哀嚎一片,目前网上两种声音:① 没办法用chatgpt了;② 利好国内大语言模型。在分析这两种说法之前,可以先来讲一下这件事情的背景,为什么OpenAI要进行限制,甚至于现在要进行这么严格的限制。
截止至2024年6月27号,在OpenAI官方文档( https://platform.openai.com/docs/supported-countries )中,列出来一共188个地区。其中不支持的国家和地区有:中国大陆、俄罗斯、伊朗、朝鲜、古巴、叙利亚 等。同时,在去年OpenAI宫斗事件结束后的董事会重组以及6月13日的公告中,引入了两位具备zz背景的董事会成员(成员背景分别为负责经济与安全)。
这个时候,大家也许能明白OpenAI进行限制的理由。
一方面国内“出于安全因素考虑”,限制了OpenAI的访问;另一方面美国对硬件(高端显卡对国内禁售)与软件双管齐下限制中国AI发展。
回到对现在网络上的两种声音的分析。对于非支持国家和地区的流量限制,一定程度上能够降低套壳应用的发行规模。但对于企业或一部分开发者来说,他们有n种办法能够绕过限制继续使用,毕竟在TikTok对sim卡级别的识别限制和地区限制,对于这部分群体来说也无碍。
另一方面说是利好国内大语言模型的发展,我认为会有提升,但实际影响并不会太高。理由如下:
1. 用户隐私的窃取。我体验了国内几乎所有大厂推出的大语言模型对话产品,无一例外的没有任何一家产品中有用户对于提交聊天内容能够自主控制的开关,哪怕做个假的开关也可,很遗憾没有。但是又无一例外的所有产品的隐私协议中都会提到产品需要收集用户对话内容来对产品进行优化。我的意思是在窃取用户隐私这方面,国内厂商遥遥领先。
我提出这个观点的目的在于,在大语言模型训练之初,由于美国对用户隐私的极致保护,他们只能够使用到有限的公开的数据进行训练;而国内厂商野蛮且极致的获取用户在网络的一切数据来进行训练,也就是国内相较于国外来说,完全不缺可用的训练元数据(可参考小宇宙APP - [张小珺 jun | 商业访谈录] 中第62期 [你们要的朱啸虎,来了] 节目中的评价)。但训练效果并没有多好。截止2024年6月26日数据,在LMSYS众包大语言模型评测网站中,国内厂商仅有一家[零一万物]的Yi-Large-preview模型堪堪排在第10名。
同时,明明国外已经有很好的开源大模型可以用于训练AI,相信很多企业宁愿用国外的现成的开源大语言模型进行训练也不用国内的现成的API,因为企业宁愿将用户数据自己拿来用,也不愿意交给他们。
平台 | 截图 |
---|---|
OpenAI | |
Kimi | |
文心一言 | |
豆包 | |
通义千问 | |
智谱清言 | |
360智脑 | |
百川-百小应 | |
… | … |
2. 硬件限制。时间需要追溯到2018年开始,美国开启对华为的制裁开始;到后续升级了一系列的对我国科技产业发展限制。2023年10月17日,美国升级了一系列的先进计算芯片、半导体制造设备出口管制规则,导致高端显卡无法在国内销售。理论上中端显卡也能训练,就是以时间换空间,但是这样如何赶超美国?
将已经发布的国内外大语言模型进行对比,国外千亿级大语言模型一大堆,万亿级的也很多。除开参数的迭代攀登,还有可预见的未来的GPT5、6。以此推断,在基础设施方面,国内的大语言模型在中短期内无法超越美国。
3. 场景限制。在 [张小珺 jun | 商业访谈录] 中第62期 [你们要的朱啸虎,来了] 节目 和 [脑放电波] 中 [和怒喵李楠聊AI硬件:乔布斯语言的可穿戴未来与20个判断,AI手机不是正确答案] 节目中都有聊到AI应用场景问题。分别从消费者和投资人的角度来看,目前市场上C端的AI产品,没有一个正解。普遍的应用场景是2B的。
实际体验感想也是这样,各大厂商发布AI对话的意义在哪儿?做一个具备普适性的AI对话产品反而会很难获取到用户拥蹩。国内或者说整个世界,存在巨大的信息差,AI的应用大量的普通人仍然是完全没有了解,就像中国还有超10亿人没有做过飞机一样;对于C端场景来说,AI应用还没有迎来“iPhone时刻”,但是“有缺陷”的AI产品(即限制AI的使用场景,使其能够更专注、更专业的做某个领域的事情)却能够从细分领域获取到用户。
在2B的AI应用中,通常只需要小模型即可解决问题,并不需要高阶模型,这就是上文为什么说,企业宁愿用开源的大语言模型训练的另外一个理由,因为训练与使用的成本都非常低。
最后总结,如果说要积极一点,在可见的GPT5/6到来之前(如果能带来iPhone时刻),AI都不会有什么太大的发展。
如果说具体讲讲对国内有什么即刻见效的实质性的利好,就是各家AI产品的用户量级涨一涨、企业营收涨一涨罢。其实说到这里,就可以引出下一个话题了:关于系统特性的更新与AI进化,是什么限制了AI的进化。
在上面我提到的节目中,李楠是前魅族科技 CMO 兼公司高级副总裁、魅蓝总裁,现任怒喵科技的创始人。他在节目中提到了一个观点:产品经理会比程序员更早的被AI替代。不敢苟同,理由如下:
- 代码是极易被标准化的,尽管一个功能通过代码能有多种不同的解法,但结果是一致的;
- 基于上一点,AI对代码的理解一定优于对自然语言的理解;
- 一个功能的设计有n种思路,每个思路都可能对应不同的产品功能形态。理论上是需要一定创意的,也可以说产品经理的工作挺抽象的;
- 根据产品经理的发展路径,现阶段产品经理岗位已经被细分为多个岗位,但各个大厂仍然对各个岗位的要求仍有一定的异同;
- 基于上一点,大中小厂对于产品经理的能力定义、工作内容定义以及工作产出定义等各方面都没有标准可参考。
由此延伸出是什么限制了AI发展的第一个阻碍:标准化。标准化意味着规范、高效和低成本。
产品经理都知道汽车与马车的故事。人们都想要更快的马车,却颠覆式创新的出现了汽车。
1885年,德国工程师卡尔·本茨发明了世界上第一辆汽车,此后汽车产业以手工作坊式的进行生产,每装配一辆汽车需要728个小时,使得汽车成为了富人的象征。1913年,福特汽车企业创新的开发出了世界上第一条流水线,亨利·福特被誉为“为世界装上轮子的人”。
人形机器人被拆分为餐厅服务机器人、家庭陪伴机器人、产业流水线机器人,这个拆分的过程就是一个在进行标准化的过程;AI应用在B端细分领域的应用是一个标准化的过程;当企业内部OA、ERP等系统被标准化到具备足够的普适性时会作为一个产品公开发售。但这个标准化的制定者一定不是大语言模型厂商,而是他们的B端客户,在一个行业足够充足的竞争之后,在经历逐步的标准化的过程之后,这个AI产品才有可能具备普适性的解决问题的能力。没有完美的人,也没有完美的AI。历史的经验告诉我们,AI应用一定会先在B端开花,然后绽放到C端。
第二个限制AI发展的阻碍是硬件特性的更新。
上文提到的汽车与马车的故事,也是一个典型的系统特性更新引起的。在前段时间iOS18迭代后,系统更新了一个密码App用于帮助用户管理密码,此前该场景一直由第三方应用提供服务。
1960年美国最早开启研究触摸屏技术的大门,最早用于军事领域。随着技术迭代发展,至2007年初代iPhone发布,为普罗大众开启了人机交互的新时代。
当硬件系统或软件系统的特性得到更新,会引发出一批新的创新,同时会湮灭一批旧有的服务。就算现阶段手机+AI能够更快速更高效的帮你处理一些任务,但那也无异与AI套壳聊天软件,就算是iPhone也是如此,只是在自动化的帮你处理一些任务,并没有将AI智慧的特性完全拟人化的展现出来。故此,现阶段手机接入的AI仍然不是最优解。但当AR/MR的硬件能够承载一个庞大的重构的虚拟显示世界时,结合AI一定会带来一个完美的体验。
第三个则是深度学习与模型。现有的算法和模型在某些任务上仍然存在局限性,特别是在处理复杂的、多样化的现实世界问题时。ChatGPT是OpenAI提供的一个演示DEMO,只能更加的拟人化(普世性),但聊天的效果却与大量用户的使用初衷相违背,为此会抱怨chatgpt变懒的情况,当你有足够的Prompt Engneering能力时,会有效的缓解这个问题。
结语:现在行业+AI,并没有到马车→汽车的质变时刻,都在做为现在工作提效的事情。AI进一步进化,只有让他更像人,并且给于更多的自由,只是这个自由被诸多伦理因素所限制。不过,我们理想中的AI已经被大量的影视作品所构建,例如《头号玩家》、《机器管家》等。