差评：分不清足球还是光头的 AI，在英超联赛中又被球迷嫌弃了

AI 在体育界有多不靠谱？

上个月，在苏格兰足球冠军联赛的赛场上，AI 摄像机将裁判员的光头识别成了足球，疯狂追了一整场。

无论哪支球队进攻，哪个球员带球，AI 都视而不见。

反而紧盯着边裁的光头不放，还时不时给个镜头特写，全场 90 分钟的足球盛宴，在家看直播的球迷们大部分时间都在围观一颗头。

“真想冲上去给教练扣一顶帽子！”不少球迷吐槽称。

由于直播画面一度非常糟糕，事后，赛事负责人还亲自发文向球迷们致歉。

这是苏格兰因弗内斯足球足球俱乐部首次在直播赛事中引入 AI 摄像机。采用 AI 技术原本是为了给球迷们提供更好的观赛体验，因为由于新冠疫情的大流行，广大球迷们不能到现场去观看比赛。

但没想到，AI 竟然翻车了，还翻得如此彻底。

这件事情发生后，赛事举办方在采用 AI 技术方面不得不变得更加慎重，因为多次翻车事件已经让球迷们极度不满。

最近，来自慕尼黑工业大学的研究人员也证实了这一点。他们利用机器学习分析了球迷们对 AI 技术的态度，结果发现：在 124 场英超联赛中，球迷们的差评率高达 41.1%，好评率仅为 25.5%。

不过，这里的 AI 技术指的并不是 AI 摄影师，而是另一项应用—VAR。

视频辅助裁判 VAR

最近，曾获得 2 次英超联赛冠军的足球运动员詹姆斯 · 米尔纳（James Milner）在 Twitter 上吐槽。

很明显，我们需要严肃讨论 VAR 的价值。不止我一个觉得当前的 AI 不适合大型足球赛事。

Milner 提到的 VAR，全称 Video Assistant Referees，是一项 AI 视频辅助裁判技术。

采用 VAR 技术的目的是：通过视频分析辅助主裁判，减少比赛中可能出现的争议和误判情况。

不同于主裁判必须亲临现场，VAR 通过摄像机捕捉到的比赛画面进行视频分析来做出判断，因此它更可能关注到一些微小的细节，因为比赛场面瞬息万变，仅凭主裁判肉眼观察难免出现争议。

当然，只有主裁的判罚出现争议时，VAR 才会派上用场。比如出现球员犯规或是越位、红牌判罚、犯规地点是否在禁区内、禁区内手球和犯规等情况时。

VAR 技术开始走向足坛是在 2016 年，当时它首次在美国职业大联盟的一场预备队杯赛中担任裁判助手，之后，经过两年的技术升级，2018 年国际足球协会理事会（IFAB）正式推出 VAR，随后它便开始被大量用于各国联赛、杯赛中。

从近几年的反馈来看，VAR 的表现让球员们非常不满。

2018 年，在世俱杯一场半决赛后，齐达内、贝尔、莫德里奇、卡塞米罗等大牌球星纷纷吐槽：“VAR 把比赛搞得支离破碎。”

而在此次之前，布冯也曾公开表示，

我知道这项技术是实验性阶段。但当这个简单的工具，让比赛频繁陷于中断，我感觉很糟糕，感觉像是在打水球一样。

近日，2020 年英超联赛正如火如荼地进行，Milner 也借此表达了他对 VAR 的看法。

不过，VAR 在比赛中的综合表现如何，是否能够继续使用，仅有球员们的反馈还是不够的，观众和粉丝们的态度也非常重要。另外，从科学的角度来讲，评估一项技术辅助工具需要进行科学的研究分析。

鉴于此，慕尼黑工业大学的研究人员利用机器学习技术对他们的态度进行了科学分析。

被嫌弃的 VAR

在体育赛事期间，有 79%的观众会通过社交媒体进行互动。

其中最为普遍的是在 Twitter 上发文。这对于 AI 来讲，是一个庞大且有效的检测数据集，而且球迷们发表的推文是情绪检测的重要指标。

因此，研究人员从 2019-2020 英超联赛 129 场比赛中，使用官方 Twitter API 收集了 643251 条推文作为研究数据集，其中 4583 条推文作为训练数据集。

另外，他们将观众情感划分为三类积极（肯定）、中立（无感）以及消极（吐槽），并训练了一个情感分类模型。

多种监督的机器学习算法均适用于训练短文本语料库的情感分类模型，在这里，研究人员使用了梯度增强方法来训练基于树的模型，因为这种方法在此类问题的研究中展现出了最佳性能。

此外，他们还采用了三个进一步的分类模型：一个是朴素贝叶斯分类器（Bayes Classifier），一个支持向量机（Support Vector Machine），另一个是基于 Bagging 的随机森林（Random Forest）。

如图，研究人员对所有模型进行了标准的 10 倍交叉验证。测试结果显示了在情感分类和主题检测（是否与 AVR 相关）这两个分类问题的 10 次交叉验证的性能度量。

在主题检测方面，基于决策树的三种方法的准确度都达到了 94%，而且在 F 值上也没有太大差异；支持向量机的表现稍差，朴素贝叶斯分类器的精度值仅为 71.0%

在情感分析中，模型达到了最高的准确性值（70.8%），可以说，该方法比传统增强方法和情感分类 / 主题检测（VAR）模型的性能都要稍好。

来看一下该模型最终的分析结果：

在 4,583 条推文中，有 31.1%被标记为与视频助理裁判（VAR）相关。在情感方面，有 25.5%的人表示为积极情绪，而有 41.1%的人表示为负面情绪，其余为中立情绪。

另外，研究人员为了比较了 94 次 VAR 事件前后不同时间间隔的平均情绪。结果发现一旦发现 VAR 事件，平均情绪就会显着下降。

这表明，采用 VAR 技术的赛事或与 VAR 相关的事件都会给观众带来明显的不满情绪。

那么如何减少观众们的消极评估，除了进一步提升技术减少乌龙事件外，研究人员在此也给提出了两条建议：

足球协会在 VAR 的使用过程中应尽可能确保透明度，即在球场上同步公布 AI 评审过程的信息。

足球管理机构需要改进现行体制，实施质询制度，让比赛各方可以通过对现场投诉来启动审查程序。

AI 赋能体育的可能性

可见，基于视觉技术的 AI，在赛事直播和辅助裁判方面还远不够成熟。

不过从现实考量来看，AI 想要做好这件事确实不容易。因为包括足球赛在内的任何大型体育赛事，不仅现场瞬息万变，涉及运动员众多，而且场地也足够大，这些外在因素对 AI、对硬件、对算法都提出了非常高的要求。

另外，它还要求系统必须有一个强大的后台大脑，能够能实时地分析若干数据，在最短的时间内提供最为科学的现场报告，这一点在辅助裁判方面体现的尤为明显。

虽然目前的 AI 技术存在明显的局限性，但这并不妨碍它在赋能体育市场的可能性。

最近几年，AI 加速渗透到体育领域，在多次翻车事件之后，其实我们可以看到 AI 技术的不断升级、优化，看到它在更多潜在应用场景的价值，比如用 AI 分析球队打法、预防球员受伤、评价球员积极性等等。

总之，热血澎湃的体育赛场需要 AI，只是一切需要慢慢来！