通过机器学习在商业竞争中脱颖而出

  作者:Dinesh Nirmal

  我注视着我的子女,对他们积极拥抱着周围快速变化的世界感到惊奇不已,他们不断适应新体验、掌握新技术、吸收如此众多来源的信息。他们从基础开始学习,首先只是接受所教给他们的事实,然后用他们自己的知识来丰富这些事实,随后又提出问题、利用他们的知识向他人表达他们的意见和价值观,进而又质疑他们曾经接受的事实和假设,再进一步更新他们的知识、理解、决策和价值体系。然后他们开始与父母一起进行推理。观察着他们的进步,着实令人感到惊奇。他们的大脑像海绵一样,利用他们的视觉、听觉、触觉、嗅觉和味觉吸收着各种信息、经验、情绪,不断地把新旧事件和情形联系到一起,从而推动知识边界的扩展并考验我们智力。

  观察我的儿子学习成长是件令人着迷的事情;但十分坦率地说,企业不能等待太多的时间来了解他们的数据,然后再据此采取最佳行动。

  从商业智能到智能商业

  商业世界非常复杂,具有许多快速变化的推动力。当我们观察孤立的时间点上所存在的信息时,我们只看到了冰山的一角,因为信息一直呈现着指数增长。我们也无法充分利用我们周围人群的集体思想或全部知识。正是在这方面,诸如形式多样的机器学习(ML)等认知技术对商界人士将产生很大的作用。

  简单地说,机器学习是计算机无需明确编程而进行学习的一种能力。

  我们可以想象成是某种具有全面信息意识的系统。多个“节点”在企业内部及云端把彼此相互连接到一起,他们犹如大脑中的突触一样彼此了解。利用这些“机器”的集体意识(不只是硬件),并利用智能就“最佳”决策提出建议,从而产生出“最优”结果,这正是各个组织机构所梦寐以求的东西。我认为,这恰恰定义了企业的杀手级应用。

  它是什么样子的呢?我将其设想为下面的图形 -- 一个持续学习的循环或工作流。

Screen Shot 2016-06-29 at 8.34.45 AM

  图1:机器学习 -- 一个持续的学习循环

  目前进展到什么程度了?

  好消息是,这些功能已存在于IBM已有的许多解决方案中,而更多的功能已经出现在我们的研究实验室中,它们将不断涌现并可能改变各行各业。

  那么,从哪里着手呢?对于知识而言,主要有四个状态:知道你所掌握的,知道你所不掌握的,不知道你所掌握的,以及不知道你所不掌握的。所有这一切都从你的数据开始。我们有各种各样的解决方案对你掌握的信息进行分类、发现你不知道你已经掌握的信息,并帮助识别缺失的或不可信的信息。这些工作都有助于减少“你不知道你所不掌握的信息”的这种情形。

  接下来,你需要在无需移动信息的情况下获取信息。对于这些数据,我们可以应用机器学习(ML),它可以发现关系、进行推理、预测接下来可能发生的事情,并实际上就这些数据以及所有以前的结果获得智能(知道一切)。这只能通过不断的学习和适应来实现。关于此学习过程的优化,还有一些其他步骤,可以参阅这里。有许多供应商声称能够提供某种形式的机器学习能力,虽然就其本身能力而言可能是有趣的,但它们自身并没有太多价值。把各种形式的学习和分析能力组合到一起可以让你更接近于实现“认知”这一更广阔的图景,而IBM一直在努力成为该领域的领导者。我以后会在博客中更详细讨论认知问题。

  从井字游戏(Tic-Tac-Toe)、危险边缘(Jeopardy!)电视节目、犯罪预防到癌症治疗,等等。

  在我早期的学生时代,我学会了利用死记硬背的学习方式编写简单的递归算法,并开发了一款井字游戏(Tic-Tac-Toe),它在经过五、六局对弈之后就不会再败北。它能够尽量避免失败的局面,从而使损失最小化,如此即保持了胜局。2011年,“Watson”参加“危险边缘”电视比赛节目并击败了顶级选手。它可以访问2亿页的结构化和非结构化内容,理解数T字节的磁盘存储内容,其中包括维基百科的全部文本,但在比赛期间它并没有接入互联网。对于每个问题提示,Watson给出的三个最可能回答被显示在电视屏幕上。Watson在该比赛的抢答装置上始终胜过其人类对手,但在若干个类别中遇到点儿麻烦,特别是那些仅给出几个字词的短提示–这类似于人类语言的歧义。它的自然语言处理能力、预测性评分以及模型是其致胜的关键。

  2013年2月,IBM、Wellpoint公司以及Memorial Sloan-Kettering癌症中心宣布将推出第一套商业开发的、基于Watson的认知计算技术,它能够与健康保险公司WellPoint(现在名为Anthem公司)相结合,为Memorial Sloan-Kettering癌症中心的医生开展肺癌治疗提供管理建议。在撰写博客时,已有近43,000家组织机构注册使用IBM Watson Healthcare分析平台。(1)

  机器学习101

  我经常被问及“你对此决定有多大信心?”在过去,我的回答通常是基于我所掌握的信息的强度–其中有些是直觉、本能或生活经验。但现在,我可以科学地给出一个具体数字–当然,以基础信息所允许的准确程度为限。事实上,多年来,成熟的IBM分析产品一直在多个行业中使用这些预测模型和评分算法(它们包含在Watson Analytics [分析功能]中)来更好地管理风险以及识别潜在的欺诈(在今后的博客中,我给你们讲讲我又一次试图租车时发生的信用卡经历)。在2015年,IBM将其SystemML捐赠给了Apache™软件基金会。SystemML是一套灵活的机器学习系统,旨在自动扩展到Spark和Hadoop®集群,并在Apache Spark™MLlib库中延伸该核心机器学习能力。我们还有许多其他形式“作为服务”来提供的机器学习功能,其中包括但不限于自然语言分类器、检索和排序、AlchemyVision,等等,我们将在后面更详细地介绍它们。下面的图示说明了如何按照一种通用模型来实施机器学习。

Screen Shot 2016-06-29 at 8.34.04 AM

  图2 - 通用机器学习模型

  超越传统ML - 通过感觉来学习。

  如前所述,IBM拥有许多其他形式的机器学习技术,它们帮助我们的认知能力在众多供应商中脱颖而出。对视觉、语言和其他机器学习技术的运用始自于更密切地模拟人类的理解、推理和学习行为。以下是世界上许多组织机构正在使用的一些关键的机器学习技术。

  AlchemyVision是一套API,它能够分析图像并返回图像中的对象、人物和文本。AlchemyVision可以通过整合图像识别来增强企业做出决策的方式。各行各业的组织机构,无论是出版商、广告商,还是电子商务提供商和企业搜索业者,他们都能够有效地将图像整合为大数据分析的一部分,用于做出关键业务决策,更好地定位广告投放、整理图像库、改善消费者体验、监控品牌形象、剖析目标市场以及改进研究等。Tabelog案例研究特别有趣。超过40,000名美食家访问Tabelog网站,他们相信Tabelog能够提供准确、可靠的建议。此外,超过20万家注册餐馆利用该网站进行品牌宣传及推销其产品。立即试用。

  自然语言分类器是一套服务,它能够让不具有机器学习或统计算法知识背景的开发人员为其应用创建自然语言界面。该服务能够理解文本背后的意图,并返回具有相关置信度的相应分类。然后,该返回值可以用于触发相应的动作,例如重定向请求或回答问题。自然语言分类器针对短文本(1000个字符或更少)进行了优化调整,并且可以被训练用于任何领域或应用。典型的使用场景是:

  解决通常由在线客服人员处理的常见客户问题。

  把SMS(短信)文本分类为个人的、工作的或推销的

  把Tweet文本分类为多个组别,例如事件、新闻或观点。

  根据该服务做出的响应,一套应用可以用来控制针对用户的结果。例如,你可以启动另一项应用,或者以某个答案做答,或者开始一次对话,或者产生任何数量的其他可能结果。

  你可以点击这里进行试用。

  检索和排序(Retrieve and Rank)是一项根据用户的查询帮助其寻找最相关信息的服务,它利用搜索与机器学习算法相结合的方法来检测数据中的“信号”。该服务建立在Apache Solr基础上,开发人员可以将其数据加载到该服务中,然后根据已知的相关结果训练某种机器学习模型,随后再利用此模型根据最终用户的问题或查询为他们提供改进的结果。检索和排序服务可以应用于许多信息检索场景。例如,经验丰富的技术人员在现场处理问题时可以请求帮助来解决某个故障,联系中心的客服人员可以请求协助来处理客户提出的问题,项目经理可以从专业服务机构中寻找特定领域的专家来组建项目团队。你可以点击这里进行试用。

  从水晶球预测到规定性行动。

  因此,预测某次飓风或预测某种结果,或者识别图像和视频,或者理解特定信息的重要性,都仅仅是第一步。现在,你需要根据这种理解来采取规定性行动,例如,在飓风中生存,或者抓住转瞬即逝的商机来获得商业利益。

  IBM不仅能够提供先进、广泛的机器学习能力并据此采取行动,而且可以在“合理的时间”完成这些工作,例如,它能够以每秒15,000次的速度预测某项贸易或银行交易是合法的还是欺诈的。在商业中,速度至关重要。

  认知+云=最佳业务成果

  因此,在某些条件下,如果提供了完整、准确的数据,机器学习似乎比人类更有优势(甚至更聪明)。现在,我们具有两方面的能力:一方面是上述广泛的先进机器学习能力,另一方面是借助于IBM完整的认知分析功能获得洞察并据此采取规定性行动的能力。把这两种能力相结合,就可以生产出许多机会,从而有可能超越你的竞争对手、充满自信地开展行动、帮助你的组织机构转变为最佳智能企业。云计算是这里的关键因素,因为它有潜力让每个人、每个物体(包括数据)互相连接。

  机器学习可以帮助认知系统以更自然、更个性化的方式进行学习、推理以及与我们互动。通过与数据、设备和人员进行交互,这些系统将变得更加智能、更加定制化。他们将帮助我们解决过去可能认为无法解决的问题,因为它们能够使用我们周围的所有信息,并在我们最需要的时候把正确的洞察或建议带到我们手边。在未来五年,机器学习应用可能带来新突破,从而以强大的新方式帮助扩大人类的能力、帮助我们做出更好的选择、关心我们并帮助我们畅游我们的世界。

  总而言之,所有形式的机器学习都有可能把人类的集体知识和意识与机器结合在一起,从而帮助我们把世界创造为更美好、更安全的家园。

  在接下来的几个月中,我和我的团队将带领你探索IBM认知和学习能力的更多方面

  当然,你无法预测我下一步会带你去哪里。

第 1 /  10 页
点击查看余下全文