毁掉南非的不是黑蜀黍，而是曼德拉的纯洁信念

深度 | 毁掉南非的不是黑蜀黍，而是曼德拉的纯洁信念

文|坏土豆

公众号|一个坏土豆(iamhtd)

为自由平等而斗争的曼德拉，在中国如雷贯耳，不仅是在全球政治领域的影响力，要知道当年beyond的被无数人传唱的「光辉岁月」，就是写的曼德拉—

在他生命里

仿佛带点唏嘘

黑色肌肤给他的意义

是一生奉献肤色斗争中

年月把拥有变做失去

疲倦的双眼带着期望

今天只有残留的躯壳

迎接光辉岁月

风雨中抱紧自由

一生经过彷徨的挣扎

自信可改变未来

光辉岁月写于1990年，现在30年过去了，曾经一度富有的南非，现在

艾滋病感染率全球第一；

社会治安问题层出不穷，谋杀率是印度的8倍左右；

曾经名列金砖五国，现在失业率高达30%-50%左右，和非洲最穷的国家冈比亚、乍得为伍…..

很多人说是黑蜀黍摧毁了南非，真的不关黑蜀黍的事，摧毁南非的，是曼德拉纯洁的信念。

1-被环保摧毁的工业；

2-南非果断弃核，是全球各大国的好朋友；

3-所谓的平等与自由，终究让南非一片混乱；

4-自由万岁，取消壁垒，终于摧毁南非经济；

5-人人平等，扶植黑蜀黍，造成事实上的种族歧视，大量精英逃离；

6-大家都说曼德拉好，他获得了无数荣誉；

多年前，西方世界举起环保的旗帜，希望反思人类历史进程，去工业化，建设绿色家园，告诉世界：对环境的破坏是人类面临的最大敌人。

中国就是在此浪潮中的众矢之的，雾霾问题被万人锤，「苍穹之下」就是完美的反应了西方的诉求，希望拆分大型国有企业，放慢工业化发展进程。

但显然中国不吃这一套。

环保是很重要，我们愿意承担大国责任，环保一定要搞，但怎么搞，不是你单方面说了算的。

你们作为人均碳排放量最大的国家，住着大HOUSE,整天开空调，有着全球最多的高油耗汽车，自己穷奢极欲让我们不发展？

你一边杀人发火，一边指责我吃狗肉？

你一边消耗着全球最多的皮草制品，一边说我不爱护动物？

脸咋恁大呢？

但是曼德拉显然不这么想，西方的纪录片，孤独的在垃圾箱里找食物吃的瘦骨嶙峋的北极熊，在岸边翻滚的、伤痕累累的小海豚让他热泪盈眶。他对西方的环保理念深信不疑。

曾经是非洲经济奇迹的南非，有着良好的积累已久的工业基础，随着曼德拉的一声令下，南非选择了相信欧美，走去工业化路线。

大部分稍有污染的工厂就被砍掉，少数幸免于难的也被套上了层层枷锁。就在这个时候，欧美的环保公司也入驻南非推广他们的环保设备。这些设备当然很贵，都是名牌，专利全部在欧美国家的手上，南非自己不能仿制，否则就要赔偿专利费赔到底裤都不剩。

为了人类的未来，为了大自然，为了我们的地球，这些不算啥。

很快的，在第一轮去工业化中幸存下来的公司也被各种政府要求引入的高额环保设备给彻底压垮，一点竞争力都木有了。

在曼德拉执政后，南非大量的技术人员已经流失了，工业化发展已步履蹒跚，而「环保」终于成为了压垮工业化的最后一根稻草。

就在这些工厂将死未死的前夕，西方世界哈哈大笑，开始大量的收购南非的企业和矿产，这些工厂该怎么搞还怎么搞，就是换了股东。

西方传诵的环保已经几十年了，到了今天

美国，早已退出了巴黎气候协定，该怎么污染环境还怎么污染环境，我死之后，管球他洪水滔天；

中国，既有了青山绿水，也成了工业强国；

南非，啥也没有……

想忽悠中国很难，因为中国从一百年的血与火中走来，蓝星上的所有灾难，打不死我的，只能让我更强大。

但是曼德兰，是个单纯的人。

曼德拉相信自由，相信正义，相信爱，他不知道的是：唯有强者才可代表自由与正义。

唯有强者才有资格爱。

纯洁的人做不了政治家，他们是好人，但是不能当政，否则只能带来灾难。

这样的人连船长都做不了。

我写古代历史的时候，很多人问我如何看待权谋。

啥是权谋呢？骗人算不算？

你带着船员去探索新大陆，要找到通向神秘东方的新航线，已经在茫茫大海上航行了3个月，前面啥都看不到，船员士气低落，大海上狂风巨浪，败血症横行病倒一片，食物清水已经所剩不多。

船员问船长：咱还能找到新大陆吗，我看咱都要交代在这海上了吧。

我是船长，我也不知道啊，你焦急你恐惧，难道我就不焦急不恐惧。

你怕死我就不怕死了？

真当哥伦布达伽马是上帝告诉他们前面就一定是新大陆？

于是我说：我也不知道啊。

我说的是实话啊，要不呢，难道让我去骗人？

大副跑过来问船长：老大我们现在往那个方向开船？

我说：我怎么知道。

别说你不敢说这句话，你声音颤抖一下士气都崩了。

你心里再焦虑再紧张也得给我笑出来。

曼德拉上台前，前南非花费巨资打造了核武器，成为核大国以图突破美苏的封锁。

为了让南非弃核，美国可以说费了九牛二虎之力，几十年里，制裁、封锁、拉拢、诱惑，什么手段都用上了，就差没直接出兵攻打和轰炸南非了，但一直没用。

曼德拉一上台，就宣布南非弃核，无条件将核武器交给联合国。既没有要求国际社会给予补偿，也没有顾及国家以前为此付出的巨大代价和南非前政府的感受。

当然，谁也不能否认，曼德拉为和平作出的伟大贡献。

美国高兴得嘴都合不拢，啥都没付出，完成了自己的目标。

但南非的国家利益呢?

曼德拉不知道，这个时候，他是船长，不是船员了。

也不是关在监狱里的囚犯了。

道德、正义、纯洁、自由、平等，这些可以追求，但所有的一切应该让位于国家利益。

就像一个船长，你可以追求这些，但是你若不能顺利带船驶出暴风雨，没有船员会根据品性来选择船长。

你不能带船逃离迷雾，你再好都没用。

曼德兰，是一个单纯善良的人。

刚登上总统之位，有记者采访曼德拉问：您打算怎么处理滞留在南非的非洲国家的非法移民?

曼德拉不假思索地说：人生而追求自由，自由的国家不会不欢迎追求自由的人民。

这句话意味着什么呢？

很多人说曼德拉前南非的经济处于世界前列，这个真不是。

原南非的数据如人均GDP的数据严重存疑，大量的黑蜀黍是在当时南非没有算做「人」的。

但曼德兰上台之初，南非的经济地位在非洲，相当于美国在美洲的地位。

在上个世纪70年代中期，南非妥妥是非洲的扛把子，工业产值占非洲的40%，电力生产占60%，钢产量占90%，电话网占54%，铁路运输量占50%。

南非经济增长率逐年上升，在1980年，经济增长率高达7.8%，位居世界第三，仅次于日本和新加坡。

不仅如此，南非富饶的矿产资源吸引着全世界的目光，南非的黄金矿占了全球的40%以上，根据1970年的数据显示，南非的黄金产量甚至占用比例惊人的达到了全球总产量的75%。

南非的铀矿有11.8万吨，占8%，在几十年前，曾经的比例是15%左右；

这两项完美匹配，一项管财力，一项管武力；

科技更是居于前列，全球第一例心脏移植手术就是在南非完成。

而曼德拉的开放移民政策相当于美国向整个美洲打开国门，会怎样，估计一年后美国的人口会达到8亿以上，葡萄牙语将成为美国的官方语言……

所以，前南非的非法移民一夜之间变成了合法的南非公民。不仅如此，由于此项政策没有限制地区和时效，移民如蝗虫一样的涌来。

什么地方的人会移民，当然是经济最烂政局最动荡的国家最找不到工作的人会来，好好的干嘛背井离乡。

结果，南非成为世界上最不安全的地区，是全世界谋杀案、抢劫案、强奸案发案率最高的国家，每10万人谋杀率达到了31，是印度的8倍以上；

有道是：

警匪枪战隔三差五,运钞车爆窃接二连四,小偷小摸随处可见,吃拿卡要屡见不鲜。

同时，艾滋病感染者人数已经达到706万，年年增长，比例达到惊人的12.57%。

曼德拉好不好，大家都说他好，移民更说他好，不过现在愿意去移民的几乎没了。

自由，是曼德拉秉持的最核心价值观，所以，在经济上，南非完全打开了国门。

曼德拉高举自由贸易的旗帜，将南非的市场完全向外国资本开放，将布尔人建设的贸易壁垒彻底冲垮，对本国的经济进行了不可弥补的伤害。

欧美产品大举进入南非，顷刻间就击溃了南非的制造业。南非国有企业的估值被严重低估，大量的资产被外国资本低价收购。

对于曼德拉来说，开放的可不仅仅是贸易，还有金融。

南非，曾经是非洲的金融中心，开普敦曾是非洲最大的金融中心。曼德拉毁掉了南非的工业以后，又对金融业下手了，三下五除二就把南非的金融地位搞没了。

金融业事关一个国家的经济安全，是国民经济的核心命脉。可是曼德拉在美国英国的鼓动下，盲目开放了金融业，竟然允许外国资本控股本国的金融企业。

于是几年时间，南非的银行和金融企业就被外国资本控制。

到今天，南非的主权评级已经跌到了几乎没有级。可曾想到，20年前南非还是金砖五国的成员之一……

他可以作为南非的精神支柱，作为南非的旗帜，但真的做不了总统。

曼德拉从监狱里面释放出来的那一刻，也许就被毁了。

他经历的斗争，太少了….

就像英国赐予了印度独立和民主，也在侵蚀着印度。曼德拉相信是他对民主自由平等的追求感动了西方世界，让西方给南非持续施压，让前南非当局最终释放了他。

伟大的西方世界的平等万岁。

西方世界封锁南非，是因为南非的种族隔离吗？克林顿轰炸贝尔格莱德，让无数无辜的人葬身火海，重要原因之一就是转移白宫莱温斯基的丑闻，他会关心黑蜀黍的死活？

2020年，我们都要感谢懂王，懂王让我们看到美国到底是个啥。

你的邻居天天给自己家孩子吃不饱穿不暖，还虐待毒打，一边指责你：凭啥让你小孩晚上9点了还在学习，你就不能让他玩下魔兽世界吗？

曼德拉从登上南非政坛开始，所有的工作出发点全是好的，但没有一件收获好的果实。

作为被布尔人长期压迫的黑蜀黍，要求权利，是没有错的，曼德拉对黑人权利的放开也是没有错的，但每次读到这里，我仿佛看到小说中的李自成。

李自成打下北京，刘宗敏疯狂敛财，李自成说：你就不能帮朕做个好皇帝吗？

刘宗敏说：少废话，皇帝之位归你，拷掠之威在我。

严格来说，曼德拉的政权并没有报复白人，而只是摧毁了国家，政府制定了很多扶植黑蜀黍的政策。比如说，要求白人工厂必须招收一定比例的黑蜀黍，即使他们不工作也不准辞退，还有一些政府重要岗位只能由黑蜀黍担任。

「也有数据说大量白人土地、房屋被强制收走分给黑蜀黍」

让黑蜀黍在政治经济上进入核心位置，没有错。

但是，首先要做的是教育，至少要让他们有具备胜任工作的能力，但曼德拉直接跳过了这一步，矫枉过正，跑步进入了平等。

结果那个时候黑蜀黍连管自己的家都管不好，直接上了无数个台阶，去管理国家。

被长期孤立与封闭的黑蜀黍的素质，根本无法胜任经济、技术与政治相关的工作，曼德拉为了推崇白人和黑人的绝对平等，要求按照政府官员数量也符合白人和和黑人的人口比例。这就导致大量有能力的白人不得不离开政府部门，转而让一些连基础逻辑都不会的人进入政府部门。

那个时候，黑蜀黍想的可不是好好把这个国家搞好，而是为了正义夺回本应该属于自己的权利。

而大量低素质的黑蜀黍涌入南非各个政府部门的直接结果便是大大降低了政府的行政效率。政府工作人员一堆文盲，怎么指导国家运行和经济增长…..

甚至于，很多黑蜀黍书都没读，就让他们去医院当医生。

这个，真的不能说是黑蜀黍的错，我昨天还在拾荒捡垃圾吃，你让我去当医生拿工薪，我能不去吗？

那为啥我屁都不懂还让我去医院呢，因为根据政策，必须要有一定比例的黑蜀黍医生。

经济上，更是一塌糊涂，黑蜀黍中的上层要拿到白人同等的财富，要夺回他们失去的一切，但又不具备创造财富的基础知识与能力。所以他们就只能利用手中的权力掀起大规模的贪污。

于是，这帮人不会想着怎么把蛋糕做大，净想着怎么让自己多分蛋糕。

自然的，南非成了最腐败，贪污最盛行的地方。

而在工业领域，招进大量的黑蜀黍。而黑蜀黍因为素质低下，公司入不敷出，很多公司就只能倒闭了。

曼德拉政府有没有歧视白人呢？

你去买香肠吃，发现别人买都是6块钱，你买就是8块钱，你质问老板凭啥歧视你。

老板说我没歧视你啊，我没给你卖贵，他们是我的熟人，我给他们便宜了两块钱而已。

这就是南非的政治正确。

从此开始，政府为了取悦让他们上位的黑蜀黍，出台了大量偏向性的优惠政策。甚至在上市的公司中董事会成员中必须有40％的黑蜀黍，另外政府的贷款和救济金一半必须分发给黑蜀黍。

原来的南非能做战斗机，现在航模都做不出来。

原来的南非能做心脏移植，现在好的医生都找不到。

最终南非的种种政策让白人精英阶层开始逃离南非，于是

医院的设施是很高端，但是没有专业能力的医生去操作；

南非矿产丰富，但是黑蜀黍不会用设备；

有些东西还能做出来，但渠道都被白人带走了；

,,,,,,

在曼德拉执政的短期内，近百万白人逃离了南非，最终留下了一个千疮百孔的南非。

曼德拉好不好，当然好，大家都说他好。

曼德拉把南非给了黑蜀黍，黑蜀黍说他好，虽然是贫穷的南非，也比原来啥都没有强，当然黑蜀黍不会想到可以让南非本可以成为一个正常的国家。

「注：南非前政府的种族隔离政策当然更邪恶更烂，但不是本文的内容」

对全球开放了市场的南非让无数国家获益，这更是被大家交口称赞，没有任何一个国家说南非不好。

曼德拉拿奖拿到手软，他在1991-1997年任非洲人国民大会主席，1998-1999年任不结盟运动秘书长。

他的自由的精神得到全球的一致好评，40年来获得了超过100项奖项，其中最显著的便是1993年的诺贝尔和平奖。2004年，南非广播公司举办了「最伟大的南非人」票选活动，结果曼德拉被选为最伟大的南非人。他作为南非政界元老，持续对时事话题发表他的见解。

曼德拉全球演讲自由、和平与平等，备受关注，所有的国家都说曼德拉是朋友。

这里，其实有一个规律，但凡获得诺贝尔和平奖的一些国家领导人，要么是喜欢战争的北美匪帮的总统如奥巴马，正所谓：把人打死了就没战争了；

要么就是把国家搞垮的人，美国一看，哦豁，你都这样了，都没打你的价值了。

从波兰的瓦文萨到苏联的戈尔巴乔夫都是这样。

你把国家都搞垮了，威胁自然就没了，哪里还会有战争。

唯一委屈的就是乌克兰总统拉夫丘克，摧毁了3000枚核弹，让世界更加和平。

结果摧毁核武器前美国好话说尽，摧毁后不仅没拿到诺奖，美国连援助都不给了…..

2013年，曼德拉去世，91个国家元首出席葬礼，联合国五常一个不拉，给予了高度评价。

曼德拉将南非开放给了全世界，他的荣誉当之无愧！

在这个丛林世界中，想让所有人说好话，要么就做狮子，让所有人都因为畏惧而说好话，要么就做人畜无害的小白兔，谁都可以吃，自然都说好话。

而成长为狮王的路上，受遭受到的非议，一定是最多的。

最后，曼德拉真的是好人，中国和南非的关系也相当不错，我们在南非有200多家大型企业和1000多家中小企业，都运行的很好。

我们希望全世界都向南非学习，曼德拉应该成为全球领导人的楷模，尤其是美国，必须要学。

转自：https://mp.weixin.qq.com/s/bX6mX92dAOm62VxfO5SQkw

斩断教育黑手，支付宝又干了件大事！

作者：张生

本文首发：鸣金网（ID：mingjin-wang）(本文不代表金融纵横谈立场）

天猫上买的东西有问题，可以直接申请支付宝退款。

孩子上课的教培机构出事，再也不用担心退费无门！

一

让家长给孩子的教育付费，就像在电商平台购物一样，没有后顾之忧。

支付宝突然开枪，要干掉预付费模式，直击广大教育培训机构的命门。

10月31日，支付宝联合校宝在线发布了一款教育行业收费解决方案“学费码”，学员报名后，只要通过“学费码”交费，这笔学费就会暂时保存在支付宝上，支付宝再根据教学进度支付相应费用给教培机构。

斩断教育黑手，支付宝又干了件大事！

说白了，支付宝要干的事同在电商平台上一样，就是为用户的付费交易做担保，只不过前者解决的是消费者对淘宝卖家的不信任，后者要摆平的是家长对教培机构跑路的顾虑。

支付宝放的这个大招，彻底断了教培机构的财路，无数家长沸腾了。

二

哪里有压迫，哪里就会有变革。

支付宝此时对教育机构下手，也是硬生生被逼出来的，教育这块原本清净的场子，已经被各路资本玩成一幅烂摊子，谁都想进来捞一把。

就在两周前，老牌连锁培训机构“优胜教育”突然被曝圈钱跑路，总部人去楼空。上千人围堵在公司现场讨要学费，有家长交了45万，但同样退费无门。

斩断教育黑手，支付宝又干了件大事！

事后，这家全国知名的机构被扒出老底，出事早已注定，只是时间问题。

因为他们干的事，无非是打着教书育人的幌子，挖空心思谋划的却是如何掏空家长的口袋。

1、拼命烧钱抢地盘开分校。这样既显得实力强大，吸引到更多家长买单，还能开出更高价的学费，圈到更多的钱。新校区几个月不能回笼资金就直接关掉，再换地方接着开。

斩断教育黑手，支付宝又干了件大事！

20年间，优胜教育在全国开了1500家分校，包括员工和招聘的老师在内，人数超过1.3万人，规模甚至超过了中国最大民办教育机构好未来。

2、老师最大的任务，不是好好上课，而是卖课。老师的工资跟卖出的课时牢牢绑定，课时抽成最高占到其工资的40%，完不成指标的老师，则会被扣工资和绩效。

斩断教育黑手，支付宝又干了件大事！

为此老师们被怂恿要家长办理预存学费，存10小时，送10小时，存的多，送的多，最低5万，最高打8折。就是基于给孩子的教育着想，有家长将自己唯一的房子卖了，用来交学费，想省的更多。

3、砸钱抢名师、不计成本的广告营销，一个都不能少。跟国内那些但凡能提上名字的K12教育平台采用的手段一样，有没有经验不重要，只要是985或211毕业的学生，在他们这里都能被包装成“名校老师”。

还需要什么资格证书？没问题，自己发就行了。

斩断教育黑手，支付宝又干了件大事！

这种模式跟前几年大火的健身房骗局有的一拼，只不过一个是卖卡，一个是卖课。玩的都是“借新还旧”的旁氏游戏，死亡的方式也都大同小异，烧钱的任何一个环节出问题，最终结局都是满盘皆输。

斩断教育黑手，支付宝又干了件大事！

疫情之下，多少教培机构干的事，就跟优胜教育一样，都是一场蓄谋已久的爆雷。

家长如何敢将给孩子教育的血汗钱，放心的交给教培机构？

三

最好的办法，就是有一个中间人做担保，起初很多人都希望银行能承担这个角色，但吃力不讨好的事银行不愿意干。

近5年以来，国内基本爆完的P2P雷，把作为资金存管的银行坑了个遍，看似用户的钱存在银行，但涉及到小额、高频的交易，资金划转还得用户自己操作，而P2P平台稍做手脚，就可以将这一权限转到自己手上，到头来银行的担保人角色成了摆设，既没赚到辛苦钱，还惹得一身骚。

斩断教育黑手，支付宝又干了件大事！

将教育机构的预付费存在银行，再由家长划给教育机构，自然也面临同样的问题，打一开始就被银行拒之门外。

这个苦差事自然而然的落到了有着有十多年电商担保交易资历的支付宝身上。

支付宝一出手就直击要害，“学费码”倡导的是学员先上课再交钱，彻底颠覆了教育机构原本“先交钱后上课”的模式，等于革了教培机构的命。

用俞敏洪的话来说，“预付费就是教育机构赚钱的命根子，没有预付费，80%的机构都活不下去”。

这种自断财路的事情，多数教培机构当然不愿意干，但这却由不得他们。

已经有不少教育机构已经接入支付宝“学费码”，因为他们明白，跟当初淘宝卖家一样，是否接入全凭自愿，但当别人都支持了，你却不支持，不管是不是心虚，结果都只能是眼睁睁看着学员被抢走。

四

中国教育界一场大风暴，已经席卷而来。

有人欢喜有人忧！

家长们终于不用再提心吊胆，自己几万块交给教育机构的血汗钱，哪一天被全部卷跑。

广大教育机构的老总们，恐怕又要彻夜难眠了，大可以现在不跟支付宝合作，但圈钱的买卖还能干多久呢？

那些被金钱的铜臭味吸引而来的资本家们，再投钱的时候，肯定会悠着点了，搞不好巨款就打了水漂。

也许接下来几年内，国内教育机构会出现剧烈洗牌，很多我们现在熟悉的大牌，明年可能就看不到了。

但这绝不是坏事，教育不应该沦为资本的游戏，把满脑子都是生意、滥竽充数的所谓教育机构清理出去，这才是教育的本源。

而这样的改变，也正是国家所需，教育所需，百姓所需。

转自：https://mp.weixin.qq.com/s/1HigLC3h7295KgDnonvOcw

GitHub 标星 7.4k！Python 魔法库之 FuzzyWuzzy

来源：Be_melting

blog.csdn.net/lys_828/article/details/106489371

【导语】：还在为日常工作中不同的数据集的字段进行匹配烦恼？今天跟大家分享FuzzyWuzzy一个简单易用的模糊字符串匹配工具包。让你多快好省的解决烦恼的匹配问题！

1. 前言

在处理数据的过程中，难免会遇到下面类似的场景，自己手里头获得的是简化版的数据字段，但是要比对的或者要合并的却是完整版的数据（有时候也会反过来）

最常见的一个例子就是：在进行地理可视化中，自己收集的数据只保留的缩写，比如北京，广西，新疆，西藏等，但是待匹配的字段数据却是北京市，广西壮族自治区，新疆维吾尔自治区，西藏自治区等，如下。因此就需要有没有一种方式可以很快速便捷的直接进行对应字段的匹配并将结果单独生成一列，就可以用到FuzzyWuzzy库。

GitHub 标星 7.4k！Python 魔法库之 FuzzyWuzzy

2. FuzzyWuzzy库介绍

FuzzyWuzzy 是一个简单易用的模糊字符串匹配工具包。它依据 Levenshtein Distance 算法，计算两个序列之间的差异。

Levenshtein Distance算法，又叫 Edit Distance算法，是指两个字符串之间，由一个转成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符，插入一个字符，删除一个字符。一般来说，编辑距离越小，两个串的相似度越大。

这里使用的是Anaconda下的jupyter notebook编程环境，因此在Anaconda的命令行中输入一下指令进行第三方库安装。

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple FuzzyWuzzy

2.1 fuzz模块

该模块下主要介绍四个函数（方法），分别为：简单匹配（Ratio）、非完全匹配（Partial Ratio）、忽略顺序匹配（Token Sort Ratio）和去重子集匹配（Token Set Ratio）

注意：如果直接导入这个模块的话，系统会提示warning，当然这不代表报错，程序依旧可以运行（使用的默认算法，执行速度较慢），可以按照系统的提示安装python-Levenshtein库进行辅助，这有利于提高计算的速度。

GitHub 标星 7.4k！Python 魔法库之 FuzzyWuzzy

2.1.1 简单匹配（Ratio）

简单的了解一下就行，这个不怎么精确，也不常用

fuzz.ratio("河南省", "河南省")>>> 100>fuzz.ratio("河南", "河南省")>>> 80

2.1.2 非完全匹配（Partial Ratio）

尽量使用非完全匹配，精度较高

fuzz.partial_ratio("河南省", "河南省")>>> 100
fuzz.partial_ratio("河南", "河南省")>>> 100

2.1.3 忽略顺序匹配（Token Sort Ratio）

原理在于：以空格为分隔符，小写化所有字母，无视空格外的其它标点符号

fuzz.ratio("西藏 自治区", "自治区 西藏")>>> 50fuzz.ratio('I love YOU','YOU LOVE I')>>> 30
fuzz.token_sort_ratio("西藏 自治区", "自治区 西藏") >>> 100fuzz.token_sort_ratio('I love YOU','YOU LOVE I') >>> 100

2.1.4 去重子集匹配（Token Set Ratio）

相当于比对之前有一个集合去重的过程，注意最后两个，可理解为该方法是在token_sort_ratio方法的基础上添加了集合去重的功能，下面三个匹配的都是倒序

fuzz.ratio("西藏 西藏 自治区", "自治区 西藏")>>> 40
fuzz.token_sort_ratio("西藏 西藏 自治区", "自治区 西藏")>>> 80
fuzz.token_set_ratio("西藏 西藏 自治区", "自治区 西藏")>>> 100

fuzz这几个ratio()函数（方法）最后得到的结果都是数字，如果需要获得匹配度最高的字符串结果，还需要依旧自己的数据类型选择不同的函数，然后再进行结果提取，如果但看文本数据的匹配程度使用这种方式是可以量化的，但是对于我们要提取匹配的结果来说就不是很方便了，因此就有了process模块。

2.2 process模块

用于处理备选答案有限的情况，返回模糊匹配的字符串和相似度。

2.2.1 extract提取多条数据

类似于爬虫中select，返回的是列表，其中会包含很多匹配的数据

choices = ["河南省", "郑州市", "湖北省", "武汉市"]process.extract("郑州", choices, limit=2)>>> [('郑州市', 90), ('河南省', 0)]# extract之后的数据类型是列表，即使limit=1，最后还是列表，注意和下面extractOne的区别

2.2.2 extractOne提取一条数据

如果要提取匹配度最大的结果，可以使用extractOne，注意这里返回的是元组类型，还有就是匹配度最大的结果不一定是我们想要的数据，可以通过下面的示例和两个实战应用体会一下

process.extractOne("郑州", choices)>>> ('郑州市', 90)
process.extractOne("北京", choices)>>> ('湖北省', 45)

3. 实战应用

这里举两个实战应用的小例子，第一个是公司名称字段的模糊匹配，第二个是省市字段的模糊匹配

3.1 公司名称字段模糊匹配

数据及待匹配的数据样式如下：自己获取到的数据字段的名称很简洁，并不是公司的全称，因此需要进行两个字段的合并 GitHub 标星 7.4k！Python 魔法库之 FuzzyWuzzy

直接将代码封装为函数，主要是为了方便日后的调用，这里参数设置的比较详细，执行结果如下： GitHub 标星 7.4k！Python 魔法库之 FuzzyWuzzy

3.1.1 参数讲解：

① 第一个参数df_1是自己获取的欲合并的左侧数据（这里是data变量）；

② 第二个参数df_2是待匹配的欲合并的右侧数据（这里是company变量）；

③ 第三个参数key1是df_1中要处理的字段名称（这里是data变量里的‘公司名称’字段）

④ 第四个参数key2是df_2中要匹配的字段名称（这里是company变量里的‘公司名称’字段）

⑤ 第五个参数threshold是设定提取结果匹配度的标准。注意这里就是对extractOne方法的完善，提取到的最大匹配度的结果并不一定是我们需要的，所以需要设定一个阈值来评判，这个值就为90，只有是大于等于90，这个匹配结果我们才可以接受

⑥ 第六个参数，默认参数就是只返回两个匹配成功的结果

⑦ 返回值：为df_1添加‘matches’字段后的新的DataFrame数据

3.1.2 核心代码讲解

第一部分代码如下，可以参考上面讲解process.extract方法，这里就是直接使用，所以返回的结果m就是列表中嵌套元祖的数据格式，样式为: [(‘郑州市’, 90), (‘河南省’, 0)]，因此第一次写入到’matches’字段中的数据也就是这种格式

注意，注意：元祖中的第一个是匹配成功的字符串，第二个就是设置的threshold参数比对的数字对象

s = df_2[key2].tolist()m = df_1[key1].apply(lambda x: process.extract(x, s, limit=limit))    df_1['matches'] = m

第二部分的核心代码如下，有了上面的梳理，明确了‘matches’字段中的数据类型，然后就是进行数据的提取了，需要处理的部分有两点需要注意的：

① 提取匹配成功的字符串，并对阈值小于90的数据填充空值

② 最后把数据添加到‘matches’字段

m2 = df_1['matches'].apply(lambda x: [i[0] for i in x if i[1] >= threshold][0] if len([i[0] for i in x if i[1] >= threshold]) > 0 else '')#要理解第一个‘matches’字段返回的数据类型是什么样子的，就不难理解这行代码了#参考一下这个格式：[('郑州市', 90), ('河南省', 0)]df_1['matches'] = m2
return df_1

3.2 省份字段模糊匹配

自己的数据和待匹配的数据背景介绍中已经有图片显示了，上面也已经封装了模糊匹配的函数，这里直接调用上面的函数，输入相应的参数即可，代码以及执行结果如下：

GitHub 标星 7.4k！Python 魔法库之 FuzzyWuzzy

数据处理完成，经过封装后的函数可以直接放在自己自定义的模块名文件下面，以后可以方便直接导入函数名即可，可以参考将自定义常用的一些函数封装成可以直接调用的模块方法。

4. 全部函数代码

#模糊匹配
def fuzzy_merge(df_1, df_2, key1, key2, threshold=90, limit=2):    """    :param df_1: the left table to join    :param df_2: the right table to join    :param key1: key column of the left table    :param key2: key column of the right table    :param threshold: how close the matches should be to return a match, based on Levenshtein distance    :param limit: the amount of matches that will get returned, these are sorted high to low    :return: dataframe with boths keys and matches    """    s = df_2[key2].tolist()
    m = df_1[key1].apply(lambda x: process.extract(x, s, limit=limit))        df_1['matches'] = m
    m2 = df_1['matches'].apply(lambda x: [i[0] for i in x if i[1] >= threshold][0] if len([i[0] for i in x if i[1] >= threshold]) > 0 else '')    df_1['matches'] = m2
    return df_1    from fuzzywuzzy import fuzzfrom fuzzywuzzy import process
df = fuzzy_merge(data, company, '公司名称', '公司名称', threshold=90)df

转自：https://mp.weixin.qq.com/s/NU7cHq0nMDzcRHkjI2eEZg