当前位置: 首页 > news >正文

企业建设网站的资金策划山东专业网站seo

企业建设网站的资金策划,山东专业网站seo,北京高端建站公司,网上商城网站建设设计方案Metrics Reporting Type of Reports 从 1.1.0 版本开始#xff0c;Iceberg 支持 MetricsReporter 和 MetricsReport API。这两个 API 允许表达不同的度量报告#xff0c;并支持一种可插拔的方式来报告这些报告。 ScanReport#xff08;扫描报告#xff09; 扫描报告Iceberg 支持 MetricsReporter 和 MetricsReport API。这两个 API 允许表达不同的度量报告并支持一种可插拔的方式来报告这些报告。 ScanReport扫描报告 扫描报告ScanReport记录了在对一个给定表进行扫描规划时收集的度量指标。除了包含一些关于该表的一般信息如快照 ID 或表名它还包括以下度量指标 总扫描规划持续时间结果中包含的数据/删除文件数量扫描/跳过的数据/删除清单文件数量扫描/跳过的数据/删除文件数量扫描的等值/位置删除文件数量 CommitReport提交报告 提交报告记录了在提交对表的更改也就是生成快照之后收集的度量指标。除了包含一些关于该表的一般信息如快照 ID 或表名它还包括以下度量指标 总持续时间提交成功所需的尝试次数增加/移除的数据/删除文件数量增加/移除的等值/位置删除文件数量增加/移除的等值/位置删除操作数量 Available Metrics Reporters LoggingMetricsReporter 这是在没有配置其他指标报告器时的默认指标报告器其目的是将结果记录到日志文件中。示例输出如下所示 INFO org.apache.iceberg.metrics.LoggingMetricsReporter - Received metrics report: ScanReport{tableNamescan-planning-with-eq-and-pos-delete-files, snapshotId2, filterref(namedata) (hash-27fa7cc0), schemaId0, projectedFieldIds[1, 2], projectedFieldNames[id, data], scanMetricsScanMetricsResult{totalPlanningDurationTimerResult{timeUnitNANOSECONDS, totalDurationPT0.026569404S, count1}, resultDataFilesCounterResult{unitCOUNT, value1}, resultDeleteFilesCounterResult{unitCOUNT, value2}, totalDataManifestsCounterResult{unitCOUNT, value1}, totalDeleteManifestsCounterResult{unitCOUNT, value1}, scannedDataManifestsCounterResult{unitCOUNT, value1}, skippedDataManifestsCounterResult{unitCOUNT, value0}, totalFileSizeInBytesCounterResult{unitBYTES, value10}, totalDeleteFileSizeInBytesCounterResult{unitBYTES, value20}, skippedDataFilesCounterResult{unitCOUNT, value0}, skippedDeleteFilesCounterResult{unitCOUNT, value0}, scannedDeleteManifestsCounterResult{unitCOUNT, value1}, skippedDeleteManifestsCounterResult{unitCOUNT, value0}, indexedDeleteFilesCounterResult{unitCOUNT, value2}, equalityDeleteFilesCounterResult{unitCOUNT, value1}, positionalDeleteFilesCounterResult{unitCOUNT, value1}}, metadata{iceberg-versionApache Iceberg 1.4.0-SNAPSHOT (commit 4868d2823004c8c256a50ea7c25cff94314cc135)}}INFO org.apache.iceberg.metrics.LoggingMetricsReporter - Received metrics report: CommitReport{tableNamescan-planning-with-eq-and-pos-delete-files, snapshotId1, sequenceNumber1, operationappend, commitMetricsCommitMetricsResult{totalDurationTimerResult{timeUnitNANOSECONDS, totalDurationPT0.098429626S, count1}, attemptsCounterResult{unitCOUNT, value1}, addedDataFilesCounterResult{unitCOUNT, value1}, removedDataFilesnull, totalDataFilesCounterResult{unitCOUNT, value1}, addedDeleteFilesnull, addedEqualityDeleteFilesnull, addedPositionalDeleteFilesnull, removedDeleteFilesnull, removedEqualityDeleteFilesnull, removedPositionalDeleteFilesnull, totalDeleteFilesCounterResult{unitCOUNT, value0}, addedRecordsCounterResult{unitCOUNT, value1}, removedRecordsnull, totalRecordsCounterResult{unitCOUNT, value1}, addedFilesSizeInBytesCounterResult{unitBYTES, value10}, removedFilesSizeInBytesnull, totalFilesSizeInBytesCounterResult{unitBYTES, value10}, addedPositionalDeletesnull, removedPositionalDeletesnull, totalPositionalDeletesCounterResult{unitCOUNT, value0}, addedEqualityDeletesnull, removedEqualityDeletesnull, totalEqualityDeletesCounterResult{unitCOUNT, value0}}, metadata{iceberg-versionApache Iceberg 1.4.0-SNAPSHOT (commit 4868d2823004c8c256a50ea7c25cff94314cc135)}}RESTMetricsReporter 当使用 RESTCatalog 时这是默认配置其目的是将指标发送到 REST 服务器在 /v1/{prefix}/namespaces/{namespace}/tables/{table}/metrics 端点如 REST OpenAPI 规范中所定义。 通过 REST 发送指标可以通过 rest-metrics-reporting-enabled默认为 true属性进行控制。 Implementing a custom Metrics Reporter 实现 MetricsReporter API 在处理传入的 MetricsReport 实例时提供了完全的灵活性。例如可以将结果发送到 Prometheus 端点或任何其他可观测性框架/系统。 下面是一个简短的示例说明了一个 InMemoryMetricsReporter它将报告存储在一个列表中并使其可用 public class InMemoryMetricsReporter implements MetricsReporter {private ListMetricsReport metricsReports Lists.newArrayList();Overridepublic void report(MetricsReport report) {metricsReports.add(report);}public ListMetricsReport reports() {return metricsReports;} }Registering a custom Metrics Reporter Via Catalog Configuration 目录属性 metrics-reporter-impl 通过指定其完全限定类名来允许注册一个指定的 MetricsReporter例如 metrics-reporter-implorg.apache.iceberg.metrics.InMemoryMetricsReporter。 Via the Java API during Scan planning 即使已经通过 metrics-reporter-impl 属性在目录级别注册了 MetricsReporter也可以在扫描规划期间提供额外的报告器如下所示 TableScan tableScan table.newScan().metricsReporter(customReporterOne).metricsReporter(customReporterTwo);try (CloseableIterableFileScanTask fileScanTasks tableScan.planFiles()) {// ... }Partitioning分区 什么是分区 分区是一种通过在写入时将相似的行分组在一起来加速查询的方法。 例如从日志表查询日志条目通常会包含一个时间范围就像这个查询在上午10点到12点之间的日志 SELECT level, message FROM logs WHERE event_time BETWEEN 2018-12-01 10:00:00 AND 2018-12-01 12:00:00;将日志表配置为按 event_time 的日期进行分区将把具有相同事件日期的日志事件分组到同一个文件中。Iceberg 跟踪那个日期并将使用它来跳过其他没有有用数据的日期的文件。 Iceberg 可以按年、月、日和小时的粒度来分区时间戳。它还可以使用分类列比如在这个日志示例中的 level将行存储在一起以加速查询。 iceberg做了什么不一样的地方 其他表格格式如 Hive 支持分区但 Iceberg 支持隐藏分区。 Iceberg 处理了表中行生成分区值的繁琐且容易出错的任务。Iceberg 自动避免读取不必要的分区。使用者无需知晓表是如何分区的也无需在他们的查询中添加额外的过滤器。Iceberg 的分区布局可以根据需要进行演变。 HIVE中的分区 为了演示差异考虑一下 Hive 将如何处理日志表。 在 Hive 中分区是显式的并且表现为一个列所以日志表会有一个名为 event_date 的列。在写入时插入操作需要为 event_date 列提供数据 INSERT INTO logs PARTITION (event_date)SELECT level, message, event_time, format_time(event_time, YYYY-MM-dd)FROM unstructured_log_source;同样搜索日志表的查询除了需要一个 event_time 过滤器外还必须有一个 event_date 过滤器。 SELECT level, count(1) as count FROM logs WHERE event_time BETWEEN 2018-12-01 10:00:00 AND 2018-12-01 12:00:00AND event_date 2018-12-01;如果缺少 event_date 过滤器Hive 会扫描表中的每一个文件因为它不知道 event_time 列与 event_date 列之间的关系。 Hive分区方式的问题 Hive 必须被给定分区值。在日志示例中它不知道 event_time 和 event_date 之间的关系。 这导致了几个问题 Hive 不能验证分区值 —— 正确值的产生取决于写入者使用错误的格式例如使用 2018-12-01 而不是 20181201会导致悄无声息的错误结果而不是查询失败使用错误的源列如 processing_time或者错误的时区也会导致错误的结果而不是失败用户需要正确编写查询使用错误的格式也会导致悄无声息的错误结果不理解表的物理布局的用户会遇到不必要的慢查询 —— Hive 不能自动转换过滤器正常工作的查询与表的分区方案绑定因此分区配置不能在不破坏查询的情况下更改 Iceberg的隐藏分区 Iceberg 通过获取列值并可选择对其进行转换来产生分区值。Iceberg 负责将 event_time 转换为 event_date并跟踪这种关系。 表的分区是使用这些关系来配置的。日志表将按照 date(event_time) 和 level 来进行分区。 因为 Iceberg 不要求用户维护分区列所以它可以隐藏分区。分区值每次都能正确产生并且总是在可能的情况下用于加速查询。生产者和消费者甚至可能看不到 event_date。 最重要的是查询不再依赖于表的物理布局。有了物理和逻辑之间的分离Iceberg 表可以随着数据量的变化随时间演进其分区方案。配置错误的表可以在不进行昂贵迁移的情况下修复。 有关所有支持的隐藏分区转换的详细信息请参阅分区转换部分。 有关更新表的分区规范的详细信息请参阅分区演化部分。
http://www.lakalapos1.cn/news/47430/

相关文章:

  • 网页设计师都在什么网站上面找素材插件 wordpress
  • 商丘哪里做网站网页设计与制作课程的思政目标
  • 网站没制作好可以备案吗阿里服务器搭建wordpress
  • 英文WordPress站点切换为中文手机网站开发成为小程序
  • 哪个旅游网站可以做私人定制小白怎么制作微信小程序
  • 做汽车价格的网站wordpress随机切换主页内容
  • 广东专业做网站排名哪家好公司网站开发需求文档
  • 做淘宝必备的网站项目推广网站
  • discuz建网站wordpress添加商品分类页
  • 家具做网站途途外贸企业网站管理系统
  • 网站换ip对优化有影响吗临海如何制作公司网站框架
  • 大规模网站mui做浏览器网站跳转
  • 怎么建立一个网站搜关键词会跳出北京附近做网站的公司有哪些
  • 诀窍的网站别人做网站要把什么要过来
  • 怎么提高网站的权重云南seo网站关键词优化软件
  • 城市建设管理网站建一个个人网站一年多少钱
  • 爱站网关键词挖掘网站建设工程师的职位要求
  • 中山网站建设包括哪些wordpress 大学
  • 高埗网站仿做如何撤销网站备案
  • 怎样做能让招聘网站记住密码建站平台社区
  • 用织梦怎么修改网站首页商品顺序开发公司成本部年终总结
  • 法律网站建设方案手机app定制开发
  • 个人备案可以做企业网站吗网站seo文章
  • 网站建设教程菜鸟教程广告推广网站怎么做
  • 佛山做外贸网站的安论坛网站建设
  • 台式电脑做网站服务器北京新闻最新消息
  • 网站建设前端学什么语言wordpress摘要字数的插件
  • 编制网站建设策划书wordpress spotless
  • 盐城市城乡建设局网站百度网站官网
  • 模板网站 seo个人兼职做建设网站