1、核心三要素——算力、算法、数据(三大基石):
算法、算力、数据作为人工智能(AI)核心三要素,相互影响,相互支撑,在不同行业中形成了不一样的产业形态。随着算法的创新、算力的增强、数据资源的累积,传统基础设施将借此东风实现智能化升级,并有望推动经济发展全要素的智能化革新。让人类社会从信息化进入智能化。
(1)算力:
在AI技术当中,算力是算法和数据的基础设施,支撑着算法和数据,进而影响着AI的发展,算力的大小代表着对数据处理能力的强弱。
(2)算法:
算法是AI的背后“推手”。
AI算法是数据驱动型算法,是AI的推动力量。
(3)数据:
在AI技术当中,数据相当于AI算法的“饲料”。
机器学习中的监督学习和半监督学习都要用标注好的数据进行训练,由此催生了大量数据标注公司,它们将处于未经处理的初级数据,转换为机器可识别信息。只有经过大量的训练,覆盖尽可能多的各种场景才能得到一个良好的模型。
2、技术基础:
人工神经网络是一种仿造神经元运作的函数演算,能接受外界资讯输入的刺激,且根据不同刺激影响的权重转换成输出的反应,或用以改变内部函数的权重结构,以适应不同环境的数学模型。
(2)靠巨量数据运作的机器学习。
科学家发现,要让机器有智慧,并不一定要真正赋予它思辩能力,可以大量阅读、储存资料并具有分辨的能力,就足以帮助人类工作。
自然语言处理的研究,是要让机器“理解”人类的语言,是人工智慧领域里的其中一项重要分支。
自然语言处理可先简单理解分为进、出计算机等两种:
其一是从人类到电脑──让电脑把人类的语言转换成程式可以处理的型式;
其二是从电脑回馈到人──把电脑所演算的成果转换成人类可以理解的语言表达出来。
要掌握处理数据相关的其他技术,其中包括了算法,代数和微积分。具备这些技能的重要性显而易见。同时我们还需要了解人类对于自然语言处理的思维过程,其中的上下文联系,隐含意图以及所描述事物间的联系等等。这需要深入洞察人类的思维过程。
数学专业的学生更容易成为一名人工智能项目中的软件开发人员,因为他们已经具备了统计学的基础,而这对人工智能或机器学习是非常重要的。相反一名普通的软件开发人员不可能简单的通过某些Python库的运用就能解决实际问题。
统计学,数据建模,大数据,深度学习和递归神经网络等知识与一种或多种编程语言相结合,对于试图进入人工智能的开发人员来说是一个比较好的出发点。进而把实际问题从更高层次的角度抽象出来,从而使的计算机能够理解并进行处理。
良好的数学知识和数据科学的学术背景,通过不同方式(各种研讨会,个人博客等)跟上这个快速发展的领域。擅长处理大数据集。能够快速掌握机器学习的工具集并将其集成到更大的项目中。
对众多相关数学知识进行梳理,并建立自己的人工智能知识体系。比如, 了解数据类型,掌握机器学习,相关算法,决策树和神经网络。还要了解业界的知名项目(开源项目,Apache,谷歌,IBM,微软,R,Python等等)。