来自 Twitter 的数据可以预测加密货币的上涨

随着加密货币在 2010 年代末和 2020 年代初飙升(并最终崩溃),Tauhid Zaman 目睹了无数加密货币的出现和消失。当它们开始时,社交媒体上可能会有一些提及,也许是公众视野中的短暂闪现,少数人致富了。然后——噗,消失了。

“作为一名科学家,我开始怀疑所有这些噪音是否存在某种模式,”耶鲁大学管理学院运营学副教授扎曼说。“我想知道这是否是一种财务上可预测的模式。”


这些硬币的关键是长期投资不是目标。你抓住浪潮,然后出去。

他和博士生 Khizar Qureshi 在 Twitter 上关注人们如何谈论新兴代币。他们发现,如果你正确衡量对话,就有可能识别出下个月前景最好的代币。

“这些代币的关键在于长期投资不是目标,”扎曼说。“你抓住浪潮,然后出去。这是一般加密货币交易的教训。”

寻找更多见解?注册以通过电子邮件获取我们的头条新闻。

电子邮件


扎曼和库雷希通过设计一种新颖的炒作方法来取得成果。人们之前曾尝试使用某个主题的原始推文量来预测结果,猜测大量推文意味着未来的强劲表现。但 Twitter 限制了可以从其网站抓取的信息量,这意味着原始信息量有时太大,任何人都无法获得有意义的样本;每月跟踪数百万条推文是不可能的。

研究人员还研究了情绪分析的预测能力:围绕给定主题的讨论是否有利?但像 #buythedip 或 #hodl 这样的内部简写,都表达了加密世界中的积极情绪,往往会逃避机器学习分析,就像以某种方式表达情绪的模因一样。

相反,Zaman 所做的是根据发布提及加密货币的推文的账户的关注者数量以及每条推文被点赞和转发的次数来制定“参与系数”。这两项指标相结合,提供了一个介于 0 到 1 之间的数字,表明在一个月内有多少人谈论和听说过该加密货币。Zaman 和 Qureshi 使用该指标跟踪了 2019 年至 2021 年间市场上出现的 48 种加密货币的样本,并进行了为期一个月的假设投资。这些投资的(假设)回报率接近 200%。


这为您提供了一种通过采样相对少量的数据来了解主题整体温度的方法。只需几千条推文,您就可以查看加密货币、电影、新品牌、新产品或政客。

“最酷的事情之一是这个信号不是单调的,”扎曼说。不出所料,研究人员发现,如果特定代币的参与系数低于某个阈值,那么就不值得购买该代币。但过多的关注也是一个坏兆头,他补充道:“如果参与系数真的很大,你也会想避免购买这种代币。” 非常高的系数似乎表明有很多机器人参与了代币,以及潜在的拉高抛售骗局,其中人们在代币崩溃之前人为地抬高了买家的兴趣。他说,那里有一个投资合理的最佳地点。

扎曼指出,这一见解对于试图限制欺诈的监管机构可能有用。如果代币在加密货币交易所上市后不久就开始引起异常大的轰动,这可能是一个危险信号,表明该代币正在被操纵。

扎曼表示,参与系数的应用范围超出了加密货币领域。事实上,他最近在另一个众所周知难以预测的领域进行了测试。在社交媒体上的一堂课上,他要求学生测试新方法是否可以预测电影表现。他们收集了几部电影的历史热议,然后试图确定哪一部会成功。动画版《超级马里奥兄弟》无疑是最受关注的电影,而且一如往常,目前已成为 2023 年票房最高的电影。

“这为你提供了一种通过采样相对少量的数据来了解某个主题的整体温度的方法,而且它似乎可以很好地预测成功,”他说。“只需几千条推文,你就可以看到一枚加密货币、一部电影,也许是一个新品牌、产品或政客。”

留学方案申请

0.075402s