Using keyword matching and Machine Learning text classification to filter the SMS, keep you away from spam messages
You can train your own machine learning model, especially if you are non-Chinese user, because I have only collect enough Chinese SMS corpus to train model. I have no corpus of other languages. I think you may have lots of messages in your phone, you can easily train a model by yourself, according to the tutorial in the app
使用基于关键字匹配和机器学习两种方法对短信进行过滤,让你远离垃圾短信的骚扰。
关键字匹配支持正则表达式,让您可以更高效地编写规则,可以使用四种类型的规则:1.发件人号码白名单、2.短信内容关键词白名单、3.发件人号码黑名单、4.短信内容关键词黑名单
除了关键字匹配方式,app还内置了2个机器学习模型,一个中文,一个英文的。同时还支持从网络下载符合规范的模型。此功能方便除了中文、英文以外的所有其他语言的用户,自己训练自己语言的模型。具体训练的方法,app内部有说明文档。app内置的中文模型是基于网络上流行的80万条已标注的短信语料再加上我自己收集到的最近的6千条短信训练而成。英文模型则是来自学术界开源的英文短信数据集,一共5574条,其中4,827 是正常短信 (86.6%) , 747条 (13.4%) 是垃圾短信,http://www.dt.fee.unicamp.br/~tiago/smsspamcollection/。感谢作者开源。模型的准确性严重取决于训练数据的实时性、覆盖面。如果你觉得模型识别率不够高,欢迎给它投喂数据。app内置了上报通道,注意在上报之前,对关键数据进行脱敏,比如姓名、手机号、住址、银行卡号等等信息,可以在上报之前,对它们进行脱敏处理。
使用教程:https://www.iamadman.com/products/smsgreatwall/howto/
更多关于app的介绍,可以访问https://www.iamadman.com/products/smsgreatwall/
隐私声明:https://www.iamadman.com/products/smsgreatwall/privacy/