本文所有的观点都只局限于2024年6月之前
本文仅代表个人浅薄的观点,不构成任何投资与决策观点。
进入人工智能领域前夕
其实我开始学习和了解人工智能算是非常晚的了。当我还在五年级的时候我就听到了Alpha Go击败了围棋世界冠军李世石。
但是那个时候我连人工智能这个词的定义都还没搞明白的,很显然如此一个轩然大波我内心却没有一点波澜。我只记得当时大人们都在讨论人工智能会对未来产生什么影响,会替代多少人。从2016年开始人工智能就频频登上年度热词,当然与AI相关的投资也在从2016年开始呈现井喷式增长。
来源:https://ourworldindata.org/grapher/private-investment-in-artificial-intelligence?time=2016..latest
旁白:2016年是人工智能资本热潮的第一浪,光2016年一年全球人工智能总投资就超过了200亿美元并且在接下来的数年中持续上升。
萌芽
虽然如此,但是人工智能这个词儿已经早已贯彻在我的脑海中。初中阶段是一个空窗期,因为忙于学业,没啥心思看外面的世界,教育体制也不允许我有心思往外看。不过当我步入高中,我觉得是时候了。那时是2020年,疫情刚开始在全球爆发。那么为了躲避疫情最简单的办法就是呆在家里。我乘着这段时间把python从前到后的好好捋了捋,为2021年我开始人工智能探索打下基础。
我每天对自己默念一遍,我就一个高一学生,我对人工智能能有多少理解呢?因为我在正式学习之前我就在中英文的各大软件或者论坛上查过了一些人工智能的入门方案。但是无一例外的是所有人都推荐你从概率论,统计学,线性代数开始学起。我承认这样的学习方式是正确的,但是对于一个还没有把它作为学业和职业的高中生来说属于是有点过了。而且我内心一直认为,人工智能就是一个应用性质非常强的学科。
比较我们都知道应用和创造或者是研究使用很大的区别的。前者一般都只会用相对已经成熟的方案,而后者是需要你掌握相关行业的基础知识才可以进行的。所以我给我的目标就是,先把人工智能玩起来。使用主流且成熟的TensorFlow先自己尝试着构建几个模型,训练试试看。
旁白视角:在我高一的这个阶段,人工智能一直是一个相对热门的词汇,但是在这个时候很多人工智能无用论已经出来了,大意就是强如Alpha Go也除了下围棋其他啥也不会,人工智能就是伪命题这样的。但是我还是非常希望在那个时间点去尝试一下人类的最新科技,毕竟这个东西可想象空间也太大了,真的很难不被他吸引。
正式实践
当我真正开始学习的时候,我就发现一切庞大的数学体系貌似都不如一个小小的import keras, tensorflow, pytorch来的快。我发现如果你不是为了研究和探索人工智能那其实学习简单的python库会变的非常简单,因为已经有无数科学家为你铺好了前路。你需要做的就是使用高级编程语言调用他们的代码。毫不夸张地说,就像非常著名的人工智能尝试案例识别手写数字一样,一个完全没有结果过AI的人也可以在非常短的时间内看懂代码,构建出最简单的神经网络。
下图是一个非常入门的mnist数据集,里面包含了上百张手写的数字。
玩归玩,学归学。这个是我在人工智能领域的第一次尝试,简单但是好玩。
然后呢,你是不是指望我说我开始新的探索????
算是,但是也不算是。因为之后我就开始尝试复线一些在图像分类方面表现良好的人工神经网络。比如说远古的VGG模型和虽然有些老但是目前依然使用非常多ResNet模型。我那个时候很显然是没有能力直接自己阅读文献来复刻的,所以我是在网络上找到了论文精读的视频然后一点点的跟着视频去复刻的。其中让我印象最深刻的是Google的GoogLeNet这个模型,因为在文章他没有介绍这个网络模型中的参数的由来。我合理猜测,谷歌可能是用了他们自家的TensorFlow模型直接用超参数搜了一把。毕竟财大气粗,但是的网络的参数量相较于现在的大模型来说简直就是零头,所以多花上一点时间让模型遍历搜索一遍也不是不可以。
以上就是我在人工智能领域最初的尝试。如果感兴趣,我也会在之后的文章中写一些我在Smart(汽车公司)实习的时候做过的一些人工智能项目。
但是本文的主题是我对人工智能的思考。
为什么说这么多不扣主题的话
因为我想让读者知道我的水平是什么,我目前不是一个人工智能领域的科研人员,我甚至还不是一个合格的调参侠。我只是尝试过非常多的模型,也学习了吴恩达的机器学习课程和商汤科技开源的mmYoLo。我目前只是一个使用者。
由于我目前不是从业者,所以我的想法,观点都是出自个人的非常的主观。参考意义大不大就需要大家自己斟酌了。
回归正题
要我说,其实现在人工智能的发展是非常拧巴的。现在是2024年中,人工智能已经持续热了一两年了,是由OpenAI引发的大模型热。讲实话我们一句看到了非常多的为了AI而AI的产品了。这些产品有啥用吗,讲实话概念很好,但是体验一坨。孕育这些的原因是什么呢,为什么一个如此可能改变人类的科技发展的这么拧巴呢?
投资者追捧
对于一些在人工智能行业从业很久的人来说,现在就是个千载难逢几机会。跳脱出原本的体制,抓住这一轮的初创公司热潮。毕竟看看现在的投资方向,基本上是只要和AI相关的活着是和大模型相关的,那基本上都会有大把的投资者来给你投资。毕竟大模型是疫情时代后的为数不多能炒起来预期炒起来热度的东西了。在投资者眼中,钱拿在手上只能贬值,人工智能这个赛道还是非常新的,有非常多的未来可以炒作。至少在这个赛道我们的创业者们还可以说理想,说愿景。投资人也乐意听。反观其他赛道,一个个都萎靡不正的,那你说你作为投资者,你更愿意去追捧现有的热点还是去一些流动性很低且未来发展不明朗的领域中呢?我想这个问题还是很好回答的。所以这里就很好的构成了一个双向奔赴的现象。创业者想借机会实现财富自由,投资者在这个时间点也没有更好的产品可以投资。这里随便举一个例子,曾经的华为天才少年稚晖君在2022年12月官宣从华为离职。并且创办了自己的初创企业智元机器人。
大模型大爆发,各公司不能掉队
其实在ChatGPT诞生之前就出现过不少语言类模型,比如说GPT2。但是由于他们的参数量都很小(相较于现在的大模型来讲)。我认为主要原因如下:之前没有机构与那一花大价钱去猛砸一个模型,就比如说GPT2其实他的参数量已经是非常惊人的,但是他的教过斌不是很好,所以当时OpenAI也不愿意投入几何倍数增长的资金去推动大模型的发展和迭代。世界上其他的科研机构或者是公司也面临着这个问题,就是人类当时无法估计模型“涌现“的临界值。再加上当时GPU算力远远不及现在。导致绝大多数的公司都不是很乐意去研究和发展更大规模的语言模型。知道后来微软给O喷AI注资30亿美金才让OpenAI重拾发展大语言模型的想法,要是没有微软的这一波投资恐怕现在我们看到ChatGPT的时间还会往后推迟更多。当一家公司取得成功之后,为了不落下队伍,大部分公司都开始相继投入更多资源进行模型训练和训练预料收集。毕竟这个大语言模型依然是基于谷歌之前发布的Transformer模型,所以各大公司复刻起来都是相当容易的。所以这也是为什么我们在OpenAI之后就立刻看到了来自全世众多公司和初创企业所创作训练的模型。毕竟这条路已经被OpenAI打通了,大家心里都有一个底了,只要大概到了特定登记的参数量之后模型就会自然而然的涌现,产生现在所谓的智能。
一切的偶然都是必然
资本是逐利的,那条赛道热哪就去那条赛道捞一笔。
公司是不喜欢掉队的,在背的公司取得了巨大成功之后,自然而然的就想复制他的成功。
但是这两类在市场中真的会扮演推动者的身份吗,我认为还有待观察。但是现在能确认的是我们真处在人工智能的泡沫期,具体这个泡沫还能吹多大,就要看在未来科学界和工业界能不能整出新的突破或者是CEO们在台上大肆宣扬我们的AI产品有多好来评判了。
斯国一兄弟