连续机器学习(CML):用于机器学习的开源CI / CD库

0
6527
Image Source: //cml.dev/#use-cases

完全是开源的,并且由创建流行的DVC(数据版本控制)库的同一开发团队制作, CML(连续机器学习)库 是一个很棒的工具,可用于自动化机器学习工作流程,包括模型训练和评估,比较项目历史中的ML实验以及监视变化的数据集。这将DevOps的功能带到了ML或MLOps。

构建CML的目的是引入ML项目和MLOps实践,从而应将其构建在传统工程工具之上,而不是作为单独的堆栈。这可能是MLOps的未来。

CML工具是根据以下原则构建的:

广告Coursera Plus标语,包含约翰·霍普金斯大学,谷歌和密歇根大学的课程,突出显示数据科学职业发展的内容
  • 用于数据科学的GitFlow。使用GitLab或GitHub管理机器学习ML实验,跟踪谁训练了ML模型或修改后的数据以及何时进行。使用DVC编码数据和模型,而不是推送到Git存储库。
  • ML实验的自动报告。在每个Git Pull Request中使用分析功能自动生成报告。
  • 没有其他服务。仅使用GitHub或GitLab和您喜欢的云服务(AWS,Azure,GCP)构建您自己的ML平台。无需数据库,服务或复杂的设置。

Github: //github.com/iterative/cml

网站: //cml.dev/

用例: //cml.dev/#use-cases

//cml.dev/
广告

发表评论

请输入您的评论!
请在这里输入您的名字

该网站使用Akismet减少垃圾邮件。 了解如何处理您的评论数据.