知识图谱与机器学习如何结合?

编辑导读:知识图谱和机器学xí,这两个看似不相关的事物,放在一起会发生什么样的化学反应?本文将从五个方面,阐述机器学xí如何与机器学xí相互作用,希望对你有帮助。

某天中午吃完饭,和一位做大数据分析、机器学xí建模相关的朋友聊天,谈及到智能决策领域的增长点和突破口,目前智能决策领域已经基本业界标准化成型的,由产品&技术各组件组成的决策引擎X,这套完整X包括智能决策平台、批liú化一体决策引擎、实时指标计算平台、风险核查平台、用户画像、数据X、设备指纹等。

这些产品&技术已趋于成熟,均很难成为智能决策领域的突破口,机器学xí、深度学xí可以带来一定增长点,不过要成为突破口比较难,毕竟模型对X来说是个黑盒子,无fǎ解释。

就目前现状而言,模型更多用于辅助决策,还无fǎ放心地仅X模型X值就真正否决掉一个用户或判断是否欺诈、是否逾期等。人们往往更相信直观可见的“证据”、人为积淀的经验、亦或X现有知识基础推理衍生出的可解释性结论,从这个角度上看,知识图谱更可能成为突破口。

虽然图谱目前还是个新手,距离真正成为突破口还有很大差距,特别是实时决策场景,毫秒级别内决策的要qiú对知识图谱的性能将是个巨大的考验,不过这不妨碍大家对她的青睐和期待。

X关系进行风险传导、智能通知预jǐng和新营销推荐,图的可视化天然优势、基于已有知识推理出新知识,X图表征得出异常结构和异常点等,这些都是图谱的优势。基于现阶段图谱的优势,结合上述提及的图实时计算、实时决策的短板,笔者梳理出知识图谱与机器学xí结合的使用场景,并分析其如何赋能X产生X价值。

近3年从事智能风控决策领域,做过知识图谱产品经理,做过智能决策、知识图谱、模型管理&模型监控等相关的项目实施,因此除产品和技术外,得益于项目上的历练,也有了一些些X思维。

结合笔者在实际的X应用场景和期间对知识图谱、机器学xí、用户画像、智能决策的理解、思考,总结出四类目前知识图谱与机器学xí的常见结合场景和结合方式。

一、知识图谱产生图特征,从关系角度丰富特征工程,提升模型效果,使决策更精准高效

数据决定了模型的上限,特征宽表则从各个纬度去刻画数据特征,在机器学xí过程中,特征工程的构建是建模最重要的环节之一。

常规的行为类、交易类、时序类、高频类等特征很容易从数据中挖掘,而关联类特征则需要数据分析师在脑海中推演可能的关联情况和关系网络构成,且需要X多次join来验证,涉及三度及其以上的多度关联时,无论是脑海推演过程抑或join逻辑都比较复杂。

如果事先构建好图Schema(实体类型&关系类型及其属性),X知识图谱直接抽取关联特征就方便很多,在实践中证明,其余条件保持不变的情况下,丰富图特征后,可以一定程度上提高模型的K-S、AUC值,某些用户画像、智能营销推荐、X、反欺诈等场景下效果显著。

X图特征丰富特征宽表,全面刻画样本表现情况,提高模型效果是目前知识图谱和机器学xí结合方式中最常见也是实践最多的一种方式。

二、机器学xíX学xí结果,丰富和增强图谱知识,使图谱更智能化

机器学xí的本质是X学xíX数据和经验得到未来的X结果,X学xí而得到的X结果本质也是一种“知识”,只是这类知识的准确性是个概率值。

当我们将机器X学xí而得来的知识输入到图谱中,在一定程度上丰富和增强图谱知识,可以使图谱更智能化。

例如,在原生图数据库中,我们知道用户的基本信息,却不知道这个人的信用分、行为分、欺诈分是多少,而机器学xíX的学xí结果使我们对“人”这个实体的认知更丰富了,知识图谱增强了知识储备,这个时候再X图表征(graph embading)得到更智能化的结果。

三、知识图谱结合机器学xí,基于已有数据输出全用户画像

在刻画全面用户画像场景下,知识图谱和机器学xí往往需要结合使用。

我们知道X都由形形X的关系构成,知识图谱所产生的关于“人”实体的标签和人与人之间的关系是“用户画像”的基本元素,机器学xí、数据X等产生的标签也是用户画像的重要组成部分。

当然在全面用户画像场景下,遵循元素越多越好的原则:关联关系越多越好,模型产生的标签越多越好,数据纬度也是越多越好。

基于知识图谱、机器学xí、数据X等综合纬度的结合,让我们更了解我们的用户,更清楚他的喜好和xí惯,然后更好地为他X(让他mǎimǎimǎi)。

四、机器学xí辅助社团划分,交叉验证定位欺诈X

第四种方式较适用于X欺诈场景,从X视角看,一般社团划分所得社团中涉黑占比较高且社团成员数量适中的会被初步划分为可疑社团,X人员再从可疑社团中进行逐一排查得到欺诈X。

然而当知识图谱进行社团划分(常见的社团划分图算fǎ有:louvian、lpa标签传播等)的样本中没有黑样本或黑样本极少时,一方面图谱只能X原生关系进行聚类得到社团,另一方面X人员初步的“可疑社团”范围也无fǎ圈定。

这个问题一般有三种解fǎ,一是人为手工打标,X人为经验给样本打标,该方式费时费力,一般不会采取除非资源足够;二是X制定规则(策略)识别出黑样本或可疑样本X行打标;三是X机器学xí模型得到可疑样本,并将阈值大于x(如0.6)的样本默认打标再输入到知识图谱中进行社团划分。

第三种解fǎ即为本文中机器学xí与知识图谱结合的第四种方式—“机器学xí产生样本标签,辅助图谱社团划分,寻找欺诈X”。

在欺诈X场景,还有种结合方式是:知识图谱产生的可疑社团成员,X模型来进行验证。

例如图谱产生某可疑社团中有200个成员,而模型对这200个成员的X结果大多数为黑,则可大程度上认为该社团为欺诈社团。当然也可以反着来,X模型X得到的黑成员里,对应在图谱上的划分情况如何,有哪些成员是在图谱的可疑社团里面。X这类交叉验证的结合方式,可以帮助我们定位可疑社团、得到欺诈X。

五、知识图谱产生X,丰富机器学xí黑样本

前文提到的“大数据分析、机器学xí建模相关的朋友”说起,目前机器学xí的痛点之一是缺乏黑样本、很多场景下建模无fǎ获取X,这时就可以X知识图谱的关联关系,X一度、二度或多度关联得到网络中的可疑名单,再加上XX经验得到更多X,扩展后的X作为机器学xí(这里主要是有X类)的标签样本输入,一定程度上可以较大提高模型效果。

相关阅读:

六个方面分析:知识图谱的价值与应用

什么是关联图谱?

收藏 (0) 打赏

以上内容不错,打赏支持一下!

打开微信/支付宝扫一扫,即可进行扫码打赏哦,分享从这里开始,精彩与您同在
点赞 (0)

声明:本站所有教程资源,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

雄发创业网 软文营销推广 知识图谱与机器学习如何结合? https://www.xiongfawang.com/531.html

常见问题

相关文章

知识图谱与机器学习如何结合?-海报

分享本文封面