数据库中的数据是宝贵的资产。 MindsDB
使您能够使用您的数据并进行预测。它通过将机器学习引入数据库来加速 ML
开发过程。
借助 MindsDB
,您可以构建、训练、优化和部署您的 ML
模型,而无需其他平台。要获得预测,只需查询您的数据和 ML
模型。继续阅读以查看一些示例。
什么是 AI 表?
MindsDB
通过采用 AI
表的概念将机器学习引入数据库。
AI
表是作为虚拟表存储在数据库中的机器学习模型。它们有助于根据您的数据进行预测。您可以在数据库中执行时间序列、回归和分类预测,并通过使用简单的 SQL
语句查询 AI
表几乎立即获得输出。
深入研究 AI 表
当前的挑战
以下在income_table
表中存储着income
、debt属性的值。
SELECT income, debt
FROM income_table;
执行时,我们得到:
+------+-----+
|income|debt |
+------+-----+
|60000 |20000|
|80000 |25100|
|100000|30040|
|120000|36010|
+------+-----+
income_table
表中数据的简单可视化如下:
如下,通过income
属性值来查询income_table
表中的debt
属性:
SELECT income, debt
FROM income_table
WHERE income = 80000;
执行结果如下所示:
+------+-----+
|income|debt |
+------+-----+
|80000 |25100|
+------+-----+
这里我们会得到如下图示:
但是当如上查询条件不存在的情况下,我们又能从这张表获得哪些信息昵?
SELECT income, debt
FROM income_table
WHERE income = 90000;
执行结果如下:
Empty set (0.00 sec)
当任何行不满足 WHERE
子句条件时,不返回任何值。
当表没有完全匹配时,查询将返回一个空集或空值。这就是 AI
表发挥作用的地方!
MindsDB提供的解决方案
让我们创建一个 debt_model
模型,该模型允许我们估算任何income
下的debt
值。我们使用 income_table
表中的数据训练 debt_model
模型。
CREATE MODEL mindsdb.debt_model
FROM income_table
PREDICT debt;
执行结果如下:
Query OK, 0 rows affected (x.xxx sec)
MindsDB
提供了 CREATE MODEL
语句。执行此语句时,预测模型在后台运行,自动创建数据的向量表示,如下所示:
现在让我们寻找一些随机income
的debt
值。为了获得近似的debt
值,我们查询 mindsdb.debt_model
模型而不是 income_table
表。
SELECT income, debt
FROM mindsdb.debt_model
WHERE income = 90000;
执行结果如下:
+------+-----+
|income|debt |
+------+-----+
|90000 |27820|
+------+-----+
这是它的样子:
为什么选择 MindsDB?
转向数据分析范式
现代商业世界正在发生转型,从基于历史数据分析的“发生了什么以及为什么”转变为基于机器学习预测建模的“将要发生什么以及我们如何实现”。
预测的成功取决于您拥有的数据和使用这些数据训练的模型。数据科学家和数据工程师需要高效且易于使用的工具来为特征工程准备数据,然后训练模型,最后部署、监控和管理这些实施以获得最佳预测置信度。
机器学习生命周期
ML
生命周期是一个由数据准备阶段、建模阶段和部署阶段组成的过程。下图显示了每个阶段中包含的所有步骤。
当前实施机器学习的解决方案遇到了各种挑战,例如耗时的准备、清理和标记大量数据,以及难以找到合格的 ML/AI
数据科学家。
ML/AI
数据科学家必须遵循的过程以实施机器学习,包括以下内容:
- 特征工程,
- 构建、训练和优化模型,
- 组装、验证模型并将其部署到生产环境中,
- 持续监控和改进模型,
- 不断训练模型,因为它们需要对现有数据进行多次训练迭代,将数据从一个系统提取、转换和加载 (
ETL
) 到另一个系统,这很复杂并且可能导致信息的多个副本。
最近的一项研究表明,64%
的公司需要一个月到一年多的时间才能将机器学习模型部署到生产中。利用现有数据库并自动化所有上述过程称为 AutoML
。 AutoML
已在企业中获得关注,使非专家能够将机器学习模型用于实际应用。
为什么选择 MindsDB?
好吧,与大多数名字一样,我们需要一个。我们喜欢科幻小说和文化系列,其中的 AI 超智能实体被称为 Minds
。所以这是我们名字的第一部分。
至于第二部分——数据库,它是不言自明的。虽然我们将来会支持各种数据,但目前,我们的目标是为现有数据存储和数据库添加智能。因此,术语 DB 应运而生。
所以我们有了它,MindsDB
。