全球最实用的IT互联网信息网站!

AI人工智能P2P分享&下载搜索网页发布信息网站地图

当前位置:诺佳网 > 电子/半导体 > EDA/IC设计 >

EDA增强数据的方法

时间:2020-05-25 14:55

人气:

作者:admin

标签: 数据传输 

导读:EDA增强数据的方法-随机从句子中抽取n个词(抽取时不包括停用词),然后随机找出抽取这些词的同义词,用同义词将原词替换。...

  (1)同义词替换(SynonymsReplaceSR)

  随机从句子中抽取n个词(抽取时不包括停用词),然后随机找出抽取这些词的同义词,用同义词将原词替换。例如将句子“我比较喜欢猫”替换成“我有点喜好猫”。通过同义词替换后句子大概率还是会有相同的标签的。

  (2)随机插入(RandomlyInsertRI)

  随机从句子中抽取1个词(抽取时不包括停用词),然后随机选择一个该词的同义词,插入原来句子中的随机位置,重复这一过程n次。例如将句子“我比较喜欢猫”改为“我比较喜欢猫有点”。

  (3)随机交换(RandomlySwapRS)

  在句子中,随机交换两个词的位置,重复这一过程n次。例如将句子“我比较喜欢猫”改为“喜欢我猫比较”。

  (4)随机删除(RandomlyDeleteRD)

  对于句子的每一个单词,都有p(=α)的概率会被删除。例如将句子“我比较喜欢猫”改为“我比较猫”。

温馨提示:以上内容整理于网络,仅供参考,如果对您有帮助,留下您的阅读感言吧!
相关阅读
本类排行
相关标签
本类推荐

CPU | 内存 | 硬盘 | 显卡 | 显示器 | 主板 | 电源 | 键鼠 | 网站地图

Copyright © 2025-2035 诺佳网 版权所有 备案号:赣ICP备2025066733号
本站资料均来源互联网收集整理,作品版权归作者所有,如果侵犯了您的版权,请跟我们联系。

关注微信