用于机器学习来分析区块链数据集是一个令人著迷的挑战。区块链数据集除了具备不可思议的潜力,可以协助我们理解加密货币资产的不道德,但是这对机器学习的实践者明确提出了十分独有的挑战。然而这些挑战被转化成为大多数传统机器学习技术的主要障碍。机器智能技术的较慢发展使得新的机器学习方法的产生沦为有可能,这些方法十分限于于区块链数据集的分析。
在IntoTheBlock,我们定期试验了这些新方法,以提升市场情报信号的效率。今天,我想要详细讲解一下机器学习领域的一些新思想,它们可以在分析区块链数据时产生有意思的结果。区块链数据集获取了一个与加密货币资产不道德涉及的独有的数据宇宙,因此,为机器学习方法的应用于获取了独有的机会。
然而,区块链数据集的性质和结构给机器学习方法带给了独有的挑战。虽然我们有可能指出区块链数据集是机器学习应用程序的天堂,但传统方法一般来说不会遇上一些意想不到的挑战:·缺乏标记数据:区块链数据集中于只有很少的标记数据可用作训练机器学习模型。
·模糊不清数据:区块链充满著了加密或模糊不清的数据,完全不有可能展开分析。·缺少基准测试模型:机器学习就是将模型与其他模型展开基准测试。在一个很少有文档记录的模型产生可靠结果的空间中,这样的结果有点艰难。
传统的机器学习思想传统的机器学习实践者将世界分成两类模型:·监督自学(Unsupervised Learning):有监督自学(Supervised Learning)这个名称回应有一名导师作为老师到场。基本上,监督自学是一种我们用于数据来教或训练机器的自学,这些数据都有很好的标记,这意味著一些数据早已有了准确的答案。
·非监督自学:非监督自学是机器用于既不分类也不标记的信息展开训练,并容许算法在没指导的情况下对该信息展开操作者。在这里,机器的任务是根据相近、模式和差异对未排序的信息展开分组,而不必须事前对数据展开任何训练。在区块链数据集中于,由于标记数据集的受限可用性,监督自学应用程序是受限的。
非监督方法有可能十分有效地,但在缺少其他模型或基准展开较为的情况下,很难辨别其性能。为了协助改良区块链数据分析中的非监督和监督方法,我们尝试用于一些近年来在机器学习社区中取得普遍注目的新方法。
新的机器学习方法,可以协助我们理解区块链数据集我们生活在机器学习研究技术的黄金时代。今天,机器学习框架和平台正在很快统合许多技术,协助构建传统监督和非监督方法之外的新功能。我们找到其中一些技术与区块链数据集的分析十分涉及。
半监督自学半监督自学是近年来倍受注目的机器学习领域之一。从概念上谈,半监督自学是监督自学的一种变体,它融合了用作训练的标记和并未标记数据集。半监督自学的原理是利用少量的带上标签的监督自学和大量的无标签的非监督自学数据,在许多情况下可以比几乎监督的模型产生更佳的准确性。
在区块链分析中,半监督自学可以用作训练模型,这些模型可以对参与者(如交换器或钱包)展开分类,而不必须倚赖大型标记数据集展开训练。例如,分类器可以自学用于几个标记地址来辨识加密货币交易,并用于一个更大的未标记地址池来展开拓展。迁入自学迁入自学是一种表示法自学,其基础是通过器重以前任务中的科学知识来掌控新任务的思想。
传统的自学是孤立无援的,只基于特定的任务、数据集和分开的训练模型。没可以从一个模型移往到另一个模型的科学知识被保有。在迁入自学中,您可以利用以前训练过的模型中的科学知识(特性、权重等)来训练新的模型。
当牵涉到到区块链数据分析时,可以用于迁入自学来建构模型,网卓新闻网,从而从以前的任务中概括出有科学知识。例如,辨识出现异常比特币移往的模型可以将其科学知识推展到以太坊区块链。
AutoML与自动化设计机器学习模型是一项难以置信的主观任务,它一般来说依赖数据科学家的经验,而这些经验没经过客观测试。一个等价的机器学习问题可以有无限个解法,很难解读我们否有这个问题的准确解法。AutoML是一种新技术,目的自动创立机器学习模型。对于等价的数据集、一系列优化指标和一些时间或资源方面的约束,AutoML方法应当需要评估成千上万的神经网络体系结构并产生拟合结果。
虽然有效地的数据科学团队有可能需要评估等价问题的12个模型,但是AutoML方法可以在比较可管理的时间内较慢搜寻成千上万的体系结构。
本文来源:PG电子平台-www.yrhappy.com