数据架构选型必读:8月数据库产品技术解析(21)

数据帧转换最初在7.2中可用。在7.3中,它们现在既可以作为单个批处理转换运行,也可以在接收新数据时持续合并新数据。

假设你正在流媒体审计日志事件,这些事件来自数据中心中许多不同的主机,你希望分析用户行为,以发现任何可疑的东西。使用数据帧,你可以按用户、主机和工作日对日志事件进行分组。因此,对于每个用户,你都有按请求类型分组的每个服务器的交互计数。通过实体组织数据并总结许多事件,可以更容易地运行不同的数值分析模型并发现异常行为。

数据帧允许机器学习分析的新可能性(例如异常值检测,它可能与上面的安全示例完美匹配),但是它们对于其他类型的可视化或自定义类型的分析也很有用。我们很想知道用户使用这个特性的目的。

数据帧转换在一个免费的基本许可下作为beta发布。

2、提高搜索量

Elasticsearch用于搜索,下面是我们在7.3中发布的一些令人兴奋的新搜索功能:

发现最不频繁的值;用于文档脚本评分的内置向量相似性函数;改进了间隔查询;有效处理具有大量动态字段的记录;更新索引同义词列表,没有索引停机时间。发布文档详见:

推荐阅读