跳转到内容

    MLOps:机器学习操作

    机器学习操作(MLOps)在数据科学领域是一个相对较新的东西. 不到五岁, 对于几乎每个行业和业务部门的组织来说,它已经被视为一项关键需求,这些组织希望通过将数据科学模型编织到其业务的核心结构中来实现模型驱动.

    然而, 组织发现在企业级实现mlop比仅仅为几个模型或单个团队实现mlop要复杂得多. 快速扩展数据科学和MLOps实践, 安全, 要在整个企业中取得成功,需要一个更广泛的mlop版本,它包含整个数据科学生命周期,并满足现在和未来各个团队的需求. 企业mlop是一种新的、健壮的mlop类别,可以解决这个问题.

    什么是MLOps?

    MLOps是一个用于大规模端到端数据科学生命周期的过程系统. 它为数据科学家提供了一个场所, 工程师, 及其他资讯科技专业人士, 在开发过程中与技术支持有效地合作, 部署, 监控, 以及机器学习(ML)模型的持续管理.

    它允许组织在整个组织中快速有效地扩展数据科学和MLOps实践, 不牺牲安全和质量. 企业MLOps专门为大规模生产环境设计,其中安全性, 治理, 合规是至关重要的. 

     

    百汇游戏官网下载是如何走到这一步的:今天的企业MLOps之旅

    直到十年前, 由于计算能力的限制,机器学习(ML)的大部分工作都是实验性的. 随着处理大量数据变得越来越现实, 那些能够将实验性ML模型转化为生产模型的公司获得了巨大的回报——但这些成功都是例外, 不是常态.

    当模型从数据科学家转移到生产工程师时,由于各种各样的原因,包括需要将模型重新编码成不同的语言以进行部署(例如,将模型转换为生产工程师),大多数项目都会陷入困境.g. Python/R vs Java), 无法重新创建用于生产中培训的数据, 部署过程没有标准化.

    这是因为大多数公司仍在使用什么 德勤 描述为ML开发和部署的“手工”方法. 这种可伸缩模式和实践的缺乏延误了数据科学的价值. DataIQ最近的一项调查结果证实了这一点,有三分之一的受访者表示这是事实 把模型投入生产花了几个月的时间. 项目项目的可见性也很有限, 超过45%的受访者不提供或定期更新. 在另一项调查中, 47%的ML项目 永远不要离开测试阶段. 在那些人当中,还有一个 28%的人失败了.

    为了克服这些挑战,数据科学社区从软件工程领域的DevOps(或开发运维)中寻找灵感. 许多概念都专注于缩短开发时间, 采取了提高速度和质量的措施. 然而, 因为数据科学和应用开发产生了非常不同的百老汇官网, 新做法, MLOps, 出生.

    企业mlop的好处是什么?

    企业mlop的一个关键好处是能够通过重复部署不同的模型和相关的持续监视这些模型,在组织中快速生成业务价值. 在实践中产生了以下具体的例子:

    业务集成

    成功的ML项目的特点是所有负责的员工从项目开始就意识到ML技术的好处. 此外,应该了解与模型实现相关的挑战. 通过mlop的结构化集成, ML模型可以长期成功地使用, 现有的应用程序可以随时更新和交换.

    技术集成

    使用MLOps流程流, 短的开发周期和质量保证,由于技术开发的事实, 测试, 集成步骤在很大程度上是自动化的. 因此,从每个项目的开始就有效地监视所有过程.

    可伸缩性

    经验表明,在实践中为ML应用程序使用可伸缩平台是值得的. 它们的优点是映射了模型的整个生命周期,并提供了从开发到实现的持续改进的可能性.

    mlop的额外好处

    除了业务集成、技术集成和可伸缩性之外,其他好处如下:

    • 通过自动化流程快速部署多个模型
    • 通过更快地构建和部署模型,加快了实现价值的时间
    • 由于改进的合作和模型的重用而提高了生产力
    • 减少使用非生产性模型的风险

    使用企业mlop, 从数据分析和数据处理到可伸缩性和跟踪,一切都可以变得更高效.

    MLOps vs. ML模型不是软件应用程序

    要理解为什么DevOps不能满足数据科学的需求,重要的是理解 关键的不同点 在模型和软件应用程序之间. 两者都涉及代码并以文件的形式保存, 但是软件的行为是预先确定的,而模型的行为则随时间而变化.

    用于开发它们的材料是不同的

    它们涉及到代码,但是它们使用不同于软件工程的技术和工具. 与软件不同的是,它们以数据作为关键输入. 他们使用更多的计算密集型算法, 所以他们受益于可扩展的计算和专门的硬件,如gpu. 他们利用了一个充满活力的开源生态系统的软件包,这个生态系统每天都在创新.

    建造它们的过程是不同的

    数据科学是研究——它是实验性的、迭代的和探索性的. 在得到一个可行的想法之前,你可能会尝试几十或数百个想法. 通常你会从另一个团队离开的地方开始, 他们的工作是发现和创新的起点. 促进突破, 数据科学团队需要工具来测试许多想法, 组织并保存这些工作, 然后再搜索并发现它.

    他们的行为是不同的

    模型根据输入的数据做出预测. 他们没有先天的正确行为,他们只是在现实世界中有更好或更坏的行为. 不像软件,它永远不需要再培训或更新,除非业务流程更改, 模型做的. 模型的性能可以随着周围世界的变化而变化, 从意外的或退化的行为中产生风险. 所以组织需要不同的方法来进行评审, 质量控制, 并持续监控以控制风险.

    企业MLOps团队中的角色

    当适当确定范围时,企业MLOps平台可以支持数据科学生命周期中涉及的每个人的需求. 而任何企业MLOps团队的组成都会因组织的不同而有所不同, 大多数成员 七种不同角色中的任何一种:

    数据科学家:常被视为MLOps球队的核心球员, 数据科学家负责分析和处理数据. 他们构建和测试ML模型,然后将模型发送到生产单元. 在一些企业中, 他们还负责监控模型投入生产后的性能.

    数据分析师:数据分析师与百老汇官网经理和业务部门协调工作,从用户数据中发现见解. 他们通常擅长不同类型的任务, 比如市场分析, 财务分析, 或者风险分析. 许多人拥有与数据科学家相当的量化技能,而其他人可以被归类为公民数据科学家,他们对需要做什么有一定的了解, 但缺乏编码技能和统计背景,无法像数据科学家那样独自工作.

    数据工程师:数据工程师管理数据的收集方式, 加工过的, 并可从软件中可靠地导入导出. 他们可能有特定领域的专业知识, 比如SQL数据库, 云平台, 以及特定的分销系统, 数据结构, 或算法. 它们在操作数据科学结果中通常是至关重要的.

    DevOps工程师: DevOps工程师为数据科学家和其他角色提供访问专用工具和基础设施的权限.g.、存储、分布式计算、gpu等.)在整个数据科学生命周期中所需要的. 他们开发方法来平衡独特的数据科学需求与其他业务的需求,以提供与现有流程和CI/CD管道的集成.

    毫升建筑师: ML架构师开发策略, 蓝图, 以及mlop使用的过程, 同时识别生命周期中固有的风险. 他们识别和评估最好的工具,并组建一个由工程师和开发人员组成的团队来开发这些工具. 在整个项目生命周期中,他们监督MLOps过程. 它们统一了数据科学家、数据工程师和软件开发人员的工作.

    软件开发人员软件开发人员与数据工程师和数据科学家一起工作, 专注于ML模型的百老汇官网化和配套基础设施. 他们基于ML架构师的蓝图开发解决方案, 选择和构建必要的工具,实施风险缓解战略

    领域专家/商务翻译:领域专家/业务翻译家对业务领域和流程有深入的了解. 它们帮助技术团队理解什么是可能的,以及如何将业务问题框定为ML问题. 它们帮助业务团队理解模型提供的价值以及如何使用它们. 在对数据有更深入的理解是至关重要的任何阶段,它们都是有用的. 

    mlop和数据科学生命周期

    数据科学的生命周期分为四个阶段:

    1. 管理:这个阶段的重点是了解项目的目标和要求,并确定工作的优先次序.
    2. 开发:这是数据科学家基于各种不同的建模技术构建和评估各种模型的地方.
    3. 部署:此阶段是模型进入可以在业务流程中用于决策制定的状态.
    4. 监控:这是生命周期的操作阶段,组织在此阶段确保模型交付预期的业务价值和性能.
    企业mlop指南
    数据科学生命周期的四个阶段.

    今天, 大多数MLOps平台只是为数据科学提供了一个稳定的平台, 数据工程通常专注于数据科学生命周期的生产端. 它们有助于防止模型因未计划的或不一致的刷新周期而降级, 没有模型通常需要的持续监测. 它们还用于测试和验证模型. 下图概述了MLOps在数据科学生命周期中的工作方式.

     

    企业组织中mlop的各个阶段

    数据科学生命周期中的mlop

    制定MLOps战略

    一个成功的MLOps策略包含多个组成部分,例如:

    统一实验管理

    如前所述,mlop通常涉及多个不同的角色一起工作. 因此,ML团队需要一个集中的平台来进行模型训练和评估. 这为整个团队提供了一个访问中心, 促进更好的跨团队沟通和快速提出彼此工作的能力.

    自动化训练与比较

    由于ML模型的数量,自动化是mlop的一个关键元素, 实验, 而且测试是如此之大,使得手工管理变得困难. 建立自动化的 管道 培训, 优化, ML模型的测试有助于减少迭代的时间,并加快将模型部署到生产的时间.

    自动部署

    在成功地训练和验证ML模型之后,需要将其部署到生产环境中. 在ML项目的整个生命周期中,这个步骤可以重复多次. 每当对模型进行改进时(eg 以超参数优化或用新数据进行再训练的形式), 必须重新部署模型. 在部署模型之前, 这个过程可能会涉及一个人在循环中对模型的性能进行审查.

    然而, 加快部署过程, 可以建立模型的自动测试,以检查模型的新版本是否满足验收标准. 一旦模型通过测试,新模型就会自动部署到生产环境中.

    自动监控

    即使在将ML模型部署到生产环境之后,MLOps也不会就此结束. 需要不断地监视生产中的模型. 由于模型的性能会随着时间的推移而下降,监视服务运行状况在mlop中比在DevOps中更为重要. 这种退化是由模型接收的输入数据的自然变化造成的,这些变化与模型在开发过程中之前训练的数据不同.

    为企业扩展mlop

    组织已经意识到这一点,即使他们已经实现了某种级别的mlop, 在安全且普遍扩展的数据科学中,仍然存在一些障碍.

    • 的基础设施. 如果不能使用强大的计算,数据科学家的工作效率将会很低, 高价值的数据, 还有最新的开源工具. 更糟糕的是,花费在使用定制工具和硬件的DevOps任务上的时间减少了创新. 许多调查已经证实了这一点 数据科学家80%的时间都在处理数据和基础设施这样一来,留给分析和洞察的空间就很小了.
    • 浪费了工作. 数据科学家通常独立工作,使用许多不同的工具. 工作的低标准化和可见性造成重复工作, 合作的障碍, 重复性差. A 最近的Forrester调查 对467家企业的调查发现,39%的受访者称,IT和开发人员“在AI之旅的关键阶段不会合作,即使他们有过合作.”
    • 生产缺陷. Gartner最近的研究 显示只有53%的项目能从AI原型进入生产. 由于数据漂移等问题,许多数据科学模型在生产中不能很好地执行. 从部署到监控的可重复流程的缺乏增加了隐藏的成本和不必要的复杂性, 延迟和合规风险.

    解决这三个挑战需要一个超越数据科学生命周期部署部分的规程, 到目前为止MLOps平台关注的是什么. 它需要企业级的功能,允许项目在端到端数据科学生命周期中更快地进展,并提供具有必要安全性的安全的、普遍伸缩的数据科学, 治理, 合规, 再现性, 和可审核特性. 由于这些原因, 领先的组织正在采用企业MLOps实践和使能平台.

    企业MLOps平台的功能

    An 企业MLOps平台 需要满足MLOps团队中所有不同成员的需求, 组织的管理, 它的工作流和生命周期, 以及整个组织的持续发展. 可以从两方面考虑企业MLOps功能:工具增强和流程转换.

    工具增强功能包括:

    • 按需访问数据和可扩展的计算
    • 按需访问集中式工具
    • 用户访问控制和安全
    • 版本控制和可复制研究

    这些功能极大地提高了数据科学和IT团队的生产力,并提供了包括数据源在内的所有数据科学工件的存储和组织, 数据集, 以及可再现性和可重用性的算法. 它们允许IT部门管理基础设施和成本, 管理和保护技术和数据, 并使数据科学家能够自助提供他们所需的工具和基础设施.

    流程转换能力包括:

    • 协作
    • 数据科学生命周期的端到端编排
    • 项目管理
    • 知识管理和治理.

    这些能力使组织能够通过最有效地利用资源,安全地、普遍地扩展数据科学, 在之前工作的基础上, 提供上下文, 加强学习循环. 每个人都使用一致的模式和实践,而不管模型是如何或在哪里开发的. 它们一起消除了手工操作, 数据科学生命周期中所有活动的低效率工作流为提高模型质量创造了动力, 将部署成功模型所需的时间从几个月减少到几周, 或几天, 并立即通知模型性能的变化,以便模型可以快速重新训练或更换.

    每个人都从成功和失败中学习. 协作还包括以非技术的方式与业务人员接触,以便他们能够理解项目和结果. 最后, 数据科学领导者可以轻松地管理工作量和跟踪项目进度, 影响和成本.

    当这些工具和流程转换功能都可用时, 企业MLOps平台可以优化数据科学生命周期中的吞吐量, 加速更多的模型从开发到生产, 同时保持他们的最佳性能,并提供重复循环所需的工具和知识.

    白皮书

    学习成为模型驱动企业的关键

    本白皮书介绍了一种在现代企业中通过扩展模型生产的整体方法 企业mlop中发现的基础技术和指导原则.

    下载指南

    Domino Enterprise MLOps平台的核心组件

    Domino Enterprise MLOps平台功能丰富,旨在使用最先进的数据科学工具和算法处理模型驱动组织的需求. 该平台为现代数据科学团队提供了三个关键功能:

    作为一个 记录制度, Domino在一个中央存储库中捕获所有数据科学工作, 所以你的团队很容易找到, 复制和重用工作. 数据科学家从零开始项目,结果发现另一个团队成员正在研究相同问题的日子一去不复返了. 而不是, 知识与可重用代码结合在一起, 工件, 从之前的实验中学习, 综合项目管理能力, 以及复制开发环境的能力.

    作为一个 综合示范厂, Domino支持从构思到生产的端到端数据科学生命周期:探索数据, 训练机器学习模型, 验证, 部署, 和监控. 然后冲洗和重复——所有的都在一个地方. 启用可重复的流程和工作流,以便更快地将模型投入生产, 启用自动监视, 更经常地对模型进行再培训和再发布, 还有更多——所有这些都是为了减少摩擦而设计的 模型速度 在你成为模型驱动企业的路上.

    最后,作为一个 自助基础设施门户, Domino自动化了大规模数据科学工作所需的耗时的DevOps任务. 只需点击几下鼠标,你就可以打开一个预先装载了你喜欢的工具的开发沙盒, 语言, 和计算, 包括流行的分布式计算框架. 在不同环境间跳转, 引入更多数据, 比较实验, 在模型上部署和迭代, 用一个为代码优先的数据科学团队优化的平台来提高工作效率.

    Domino企业MLOps平台

    Domino的企业MLOps平台的好处

    采用Domino Enterprise MLOps平台的客户一致指出了三个主要原因,使他们能够有效地扩展数据科学:

    开放 & 灵活的

    Domino支持 广泛的生态系统 开源和商业工具和基础设施. 不像SageMaker是aws专用的, 或者与Spark绑定的Databricks, Domino是一个开放系统. Domino独特的体系结构支持预置, 云和混合环境的最大灵活性. Domino支持最新的工具、包和计算框架,如Spark、Ray和Dask.

    为团队而建

    Domino是为大规模数据科学而设计的. 使用不同工具的团队可以在项目上无缝协作,并依赖Domino自动跟踪所有数据科学工件. Domino建立了完全可见性, 可重复性, 以及每个用例在任何时候的可再现性. 仪表板让经理们设定项目目标并检查飞行中的工作.

    集成的工作流

    Domino集成了工作流,以加速从实验到生产的端到端数据科学生命周期. 例如, Domino自动为部署的模型设置预测数据捕获管道和模型监视,以确保模型性能达到峰值. Domino的集成方法确保参与数据科学的每个人都能最大化他们的生产力和影响.

     

    使用Domino数据实验室企业mlop的模型驱动的未来

    在短短几年内, 数据科学为百汇游戏官网下载带来了自动驾驶汽车, 风险分析引擎, α去, 电影推荐引擎, 甚至一个 逼真的绘画app. 所有人都在猜测数据科学将把百汇游戏官网下载带向何方(具体来说, 一个创新的、经过充分研究的猜测).

    在未来十年里,扩展ML创新的公司将是那些模型驱动的公司, 从他们的项目中赚钱, 建立在每一个后续的成功之上, 学习更快, 更有效地开发, 降低成本, 将不良结果最小化.

    你的公司努力成为模型驱动的吗? 与Domino Data Lab合作以确保您的公司成功. 要查看Domino Enterprise MLOps平台的实际运行情况,您可以这样做 观看演示 或者你自己试试 免费试用.

    相关企业MLOps资源

    博客
    企业MLOps如何推动数据科学:4个真实的用例
    博客
    7企业mlop中的主要角色和职责