手机版
扫描查看手机站

无需编码:用Excel也能解决AI问题

来源:互联网/编辑:IT世界网/时间:2021-12-13

在手机上看

扫一扫进入手机端

如今,机器学习和深度学习已经成为各种日常应用的重要组成部分。正是通过制定正确的策略,将机器学习算法融入到运营和流程中,许多企业才能实现快速蓬勃的发展。相应地,任何忽视人工智能重大进步的竞争对手,都将在市场上失去立足之地。

但是掌握机器学习知识是一个艰难的过程。每个人都需要从扎实的线性代数和微积分知识开始,掌握Python等编程语言,掌握Numpy、Scikit-learn、TensorFlow、PyTorch等数据科学和机器学习库。

如果需要创建一个具备集成和扩展能力的机器学习系统,还需要熟悉亚马逊AWS、微软Azure、谷歌云等云平台。

显然,很多朋友根本不打算把自己培养成机器学习工程师。然而,我们不得不承认,这些数据科学和机器学习知识确实可以给企业或组织的领导者带来很多好处。好消息是,目前有几门课程提供了机器学习和深度学习的宏观概述,并不要求你深入学习数学和编码技巧。

但是结合自己的经验,要真正建立起对数据科学和机器学习的认知,必须有一定的算法实践经验。在这方面,微软Excel无疑是一个有价值但往往被忽视的工具。

无需编码:用Excel解决AI问题

注《通过Excel学习数据挖掘:逐步理解机器学习方法》周红

对于大多数人来说,微软Excel只是一个电子表格应用程序,负责以表格形式存储数据,并执行基本的数学运算。但事实上,Excel是一个强大的计算工具,可以解决复杂的问题,它包含了许多功能,甚至允许您直接在工作簿中创建机器学习模型。

虽然我已经使用Excel数学工具很多年了,但是直到接触到周红在《通过Excel学习数据挖掘:逐步理解机器学习方法》中提出的学习方法(通过Excel 3360a了解机器学习方法的分步方法学习数据挖掘),我才意识到Excel在数据科学和机器学习领域的学习和应用意义。

介绍了如何通过Excel逐步掌握机器学习的基础知识,同时也展示了如何利用Excel的基本功能和先进工具实现各种算法。

虽然Excel永远无法取代Python机器学习,但学习AI基础知识,不用写代码就能解决各种基础问题,仍然是一个极好的入门选项。

使用Excel进行线性回归机器学习

线性回归是一种简单的机器学习算法,在分析数据和预测结果方面发挥着重要作用。具体来说,线性回归特别适合处理那些排列整齐的表格数据。Excel提供了许多功能来帮助您从电子表格中的数据创建回归模型。

数据图工具作为一种直观的工具,可以提供强大的数据可视化功能。例如,您可以通过散点图在笛卡尔平面上显示数据值。但Excel图表工具除了显示数据分布外,还可以创建机器学习模型来预测数据值的变化。这个叫做趋势线的函数可以根据你的数据创建一个回归模型。您可以在趋势线上选择多种回归算法,包括线性、多项式、对数和指数。您还可以配置图表来显示机器学习模型中的参数,从而预测新的观察结果。

当然,也可以在同一个图表中添加多条趋势线,快速测试和比较不同机器学习模型在同一批数据上的性能。

无需编码:用Excel解决AI问题

注意:Excel中的趋势线函数可以根据数据创建回归模型。除了经验图表工具,《通过Excel学习数据挖掘》还提供了一些其他的经验流程,帮助你开发更高级的回归模型。它涵盖了LINEST、LINREG等公式,可以根据你的训练数据计算出机器学习模型所需的参数。

作者还带领大家一步步使用其他Excel基本公式(如SUM、SUMPRODUCT)创建线性回归模型。整本书遵循类似的套路:介绍机器学习模型中使用的数学公式,了解其背后的基本原理,通过组合多个单元格和单元格数组中的值和公式,逐步创建模型。

这一切离生产级的数据科学工作还很远,但在学习机器学习方面是有效的,这足以帮助人们快速掌握各种常用的机器学习算法。

通过Excel掌握其他机器学习算法

除了回归模型,还可以将其他机器学习算法应用到Excel中。《通过Excel学习数据挖掘》还提供了丰富的有监督和无监督机器学习算法,包括K均值聚类、K近邻、朴素贝叶斯分类和决策树等。

虽然整个过程可能看起来有点混乱,但请遵守规则。

节进行,大家会很快摸索出其中的逻辑。以k均值聚类为例,我们将在这一章中通过多个工作表使用大量Excel公式与函数(INDEX, IF, AVERAGEIF, ADDRESS等),借此计算聚类中心并对其进行优化。这并不是最有效的聚类方法,但在通过一个个工作表对聚类进行不断完善的过程中,您将获得良好的观察与研究机会。更重要的是,这种体验与传统编程书籍大不相同。一般的编程书籍往往引导读者直接使用数据点与机器学习库函数,借此直接输出聚类及其属性。

无需编码:用Excel解决AI问题

图注:在Excel上进行k均值聚类时,可以在连续的工作表上进行聚类细化。

在决策树一章中,我们将首先计算熵,再为机器学习模型中的各个分支选择特征。这个过程非常缓慢而且需要大量人为操作,但却能给各位带来有效的机器学习算法理解视角与体验。

在本书的多数章节中,我们都会使用求解器工具尝试实现损失函数最小化。在这里,大家会深刻体会到Excel的局限性——即使是只包含十几项参数的简单模型,也可能令计算机陷入缓慢的抓取当中。而一旦数据样本多达几百行,速度更是令人抓狂。但在对机器学习模型参数进行调优的过程中,求解器能够表现出强大的功能。

无需编码:用Excel解决AI问题

图注:Excel的求解器工具能够调优模型参数并实现损失函数最小化。

通过Excel进行深度学习与自然语言处理

《通过Excel学习数据挖掘》还提到,Excel甚至能够实现某些高级机器学习算法。其中一章专门研究如何精心设计深度学习模型。首先,我们将创建一套包含约10项参数的单层人工神经网络。接下来,我们扩展其概念,创建出包含隐藏层的深度学习模型。虽然整个计算过程缓慢且效率低下,但确实可以正常起效,通过单元格值、公式以及强大的求解器工具实现深度学习推理。

无需编码:用Excel解决AI问题

图注:使用微软Excel进行深度学习,可帮助你深入理解深度神经网络的运作方式。

在最后一章中,我们将使用Excel创建一款最基础的自然语言处理(NLP)应用程序,借此建立情感分析机器学习模型。大家需要使用公式创建“词袋模型”,借此对酒店评论进行预处理与令牌化,而后根据肯定与否定关键字的密度对内容进行分类。在此过程中,大家将学到很多关于当代AI如何处理语言内容,以及AI与人类在处理局面及口头语言方面有何不同的专业知识。

Excel——强大的机器学习工具

无论你身为企业中的决策者、来自人力资源部门还是负责管理供应链及制造工厂,要想与数据科学家及AI技术人员协同合作,掌握机器学习方面的基础知识都非常重要。同样的,如果你身为报道AI动态的记者,或者身在为企业内机器学习团队发声的公关部门,理解相关工作原理也是编撰报道文章的重要基础。在我看来,《通过Excel学习数据挖掘》是一本易于阅读且节奏顺畅的好书,足以帮助大家一鼓作气上完这关于AI知识的第一课。

除了学习基础知识之外,Excel还可以作为我们机器学习工具集的强大补充。虽然它不适合处理庞大的数据集与复杂的算法,但足以针对小批量数据完成可视化及分析。你从Excel快速挖掘中获得的结果,将为后续的探索方向与机器学习算法选择提供重要洞见,最终引导你走上解决问题的正确道路。

IT世界网 www.hnce.org 版权所有 豫ICP备10007855号-1

IT世界网游戏下载基地温馨提示:适度游戏娱乐,沉迷游戏伤身,合理安排时间,享受健康生活

免责声明:本站部分内容、图片来自于网络及其他公共渠道,内容仅供参考。版权归原作者所有,如涉及作品内容、版权和其它问题,请发邮件通知我们,我们将在第一时间处理。