
























转自:https://mp.weixin.qq.com/s/bX6mX92dAOm62VxfO5SQkw
分享个人经验,保留阅读记录,做时间的朋友

























转自:https://mp.weixin.qq.com/s/bX6mX92dAOm62VxfO5SQkw
作者:张生
本文首发:鸣金网(ID:mingjin-wang)(本文不代表金融纵横谈立场)
天猫上买的东西有问题,可以直接申请支付宝退款。
孩子上课的教培机构出事,再也不用担心退费无门!
一
让家长给孩子的教育付费,就像在电商平台购物一样,没有后顾之忧。
支付宝突然开枪,要干掉预付费模式,直击广大教育培训机构的命门。
10月31日,支付宝联合校宝在线发布了一款教育行业收费解决方案“学费码”,学员报名后,只要通过“学费码”交费,这笔学费就会暂时保存在支付宝上,支付宝再根据教学进度支付相应费用给教培机构。

说白了,支付宝要干的事同在电商平台上一样,就是为用户的付费交易做担保,只不过前者解决的是消费者对淘宝卖家的不信任,后者要摆平的是家长对教培机构跑路的顾虑。
支付宝放的这个大招,彻底断了教培机构的财路,无数家长沸腾了。
二
哪里有压迫,哪里就会有变革。
支付宝此时对教育机构下手,也是硬生生被逼出来的,教育这块原本清净的场子,已经被各路资本玩成一幅烂摊子,谁都想进来捞一把。
就在两周前,老牌连锁培训机构“优胜教育”突然被曝圈钱跑路,总部人去楼空。上千人围堵在公司现场讨要学费,有家长交了45万,但同样退费无门。

事后,这家全国知名的机构被扒出老底,出事早已注定,只是时间问题。
因为他们干的事,无非是打着教书育人的幌子,挖空心思谋划的却是如何掏空家长的口袋。
1、拼命烧钱抢地盘开分校。这样既显得实力强大,吸引到更多家长买单,还能开出更高价的学费,圈到更多的钱。新校区几个月不能回笼资金就直接关掉,再换地方接着开。

20年间,优胜教育在全国开了1500家分校,包括员工和招聘的老师在内,人数超过1.3万人,规模甚至超过了中国最大民办教育机构好未来。
2、老师最大的任务,不是好好上课,而是卖课。老师的工资跟卖出的课时牢牢绑定,课时抽成最高占到其工资的40%,完不成指标的老师,则会被扣工资和绩效。

为此老师们被怂恿要家长办理预存学费,存10小时,送10小时,存的多,送的多,最低5万,最高打8折。就是基于给孩子的教育着想,有家长将自己唯一的房子卖了,用来交学费,想省的更多。
3、砸钱抢名师、不计成本的广告营销,一个都不能少。跟国内那些但凡能提上名字的K12教育平台采用的手段一样,有没有经验不重要,只要是985或211毕业的学生,在他们这里都能被包装成“名校老师”。
还需要什么资格证书?没问题,自己发就行了。

这种模式跟前几年大火的健身房骗局有的一拼,只不过一个是卖卡,一个是卖课。玩的都是“借新还旧”的旁氏游戏,死亡的方式也都大同小异,烧钱的任何一个环节出问题,最终结局都是满盘皆输。

疫情之下,多少教培机构干的事,就跟优胜教育一样,都是一场蓄谋已久的爆雷。
家长如何敢将给孩子教育的血汗钱,放心的交给教培机构?
三
最好的办法,就是有一个中间人做担保,起初很多人都希望银行能承担这个角色,但吃力不讨好的事银行不愿意干。
近5年以来,国内基本爆完的P2P雷,把作为资金存管的银行坑了个遍,看似用户的钱存在银行,但涉及到小额、高频的交易,资金划转还得用户自己操作,而P2P平台稍做手脚,就可以将这一权限转到自己手上,到头来银行的担保人角色成了摆设,既没赚到辛苦钱,还惹得一身骚。

将教育机构的预付费存在银行,再由家长划给教育机构,自然也面临同样的问题,打一开始就被银行拒之门外。
这个苦差事自然而然的落到了有着有十多年电商担保交易资历的支付宝身上。
支付宝一出手就直击要害,“学费码”倡导的是学员先上课再交钱,彻底颠覆了教育机构原本“先交钱后上课”的模式,等于革了教培机构的命。
用俞敏洪的话来说,“预付费就是教育机构赚钱的命根子,没有预付费,80%的机构都活不下去”。
这种自断财路的事情,多数教培机构当然不愿意干,但这却由不得他们。
已经有不少教育机构已经接入支付宝“学费码”,因为他们明白,跟当初淘宝卖家一样,是否接入全凭自愿,但当别人都支持了,你却不支持,不管是不是心虚,结果都只能是眼睁睁看着学员被抢走。
四

中国教育界一场大风暴,已经席卷而来。
有人欢喜有人忧!
家长们终于不用再提心吊胆,自己几万块交给教育机构的血汗钱,哪一天被全部卷跑。
广大教育机构的老总们,恐怕又要彻夜难眠了,大可以现在不跟支付宝合作,但圈钱的买卖还能干多久呢?
那些被金钱的铜臭味吸引而来的资本家们,再投钱的时候,肯定会悠着点了,搞不好巨款就打了水漂。
也许接下来几年内,国内教育机构会出现剧烈洗牌,很多我们现在熟悉的大牌,明年可能就看不到了。
但这绝不是坏事,教育不应该沦为资本的游戏,把满脑子都是生意、滥竽充数的所谓教育机构清理出去,这才是教育的本源。
而这样的改变,也正是国家所需,教育所需,百姓所需。
来源:Be_melting
blog.csdn.net/lys_828/article/details/106489371
在处理数据的过程中,难免会遇到下面类似的场景,自己手里头获得的是简化版的数据字段,但是要比对的或者要合并的却是完整版的数据(有时候也会反过来)
最常见的一个例子就是:在进行地理可视化中,自己收集的数据只保留的缩写,比如北京,广西,新疆,西藏等,但是待匹配的字段数据却是北京市,广西壮族自治区,新疆维吾尔自治区,西藏自治区等,如下。因此就需要有没有一种方式可以很快速便捷的直接进行对应字段的匹配并将结果单独生成一列,就可以用到FuzzyWuzzy库。

FuzzyWuzzy 是一个简单易用的模糊字符串匹配工具包。它依据 Levenshtein Distance 算法,计算两个序列之间的差异。
Levenshtein Distance算法,又叫 Edit Distance算法,是指两个字符串之间,由一个转成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。一般来说,编辑距离越小,两个串的相似度越大。
这里使用的是Anaconda下的jupyter notebook编程环境,因此在Anaconda的命令行中输入一下指令进行第三方库安装。
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple FuzzyWuzzy
该模块下主要介绍四个函数(方法),分别为:简单匹配(Ratio)、非完全匹配(Partial Ratio)、忽略顺序匹配(Token Sort Ratio)和去重子集匹配(Token Set Ratio)
注意: 如果直接导入这个模块的话,系统会提示warning,当然这不代表报错,程序依旧可以运行(使用的默认算法,执行速度较慢),可以按照系统的提示安装python-Levenshtein库进行辅助,这有利于提高计算的速度。

简单的了解一下就行,这个不怎么精确,也不常用
fuzz.ratio("河南省", "河南省")> 100>fuzz.ratio("河南", "河南省")> 80
尽量使用非完全匹配,精度较高
fuzz.partial_ratio("河南省", "河南省")>>> 100fuzz.partial_ratio("河南", "河南省")>>> 100
原理在于:以 空格 为分隔符,小写 化所有字母,无视空格外的其它标点符号
fuzz.ratio("西藏 自治区", "自治区 西藏")>>> 50fuzz.ratio('I love YOU','YOU LOVE I')>>> 30fuzz.token_sort_ratio("西藏 自治区", "自治区 西藏")>>> 100fuzz.token_sort_ratio('I love YOU','YOU LOVE I')>>> 100
相当于比对之前有一个集合去重的过程,注意最后两个,可理解为该方法是在token_sort_ratio方法的基础上添加了集合去重的功能,下面三个匹配的都是倒序
fuzz.ratio("西藏 西藏 自治区", "自治区 西藏")> 40fuzz.token_sort_ratio("西藏 西藏 自治区", "自治区 西藏")> 80fuzz.token_set_ratio("西藏 西藏 自治区", "自治区 西藏")> 100
fuzz这几个ratio()函数(方法)最后得到的结果都是数字,如果需要获得匹配度最高的字符串结果,还需要依旧自己的数据类型选择不同的函数,然后再进行结果提取,如果但看文本数据的匹配程度使用这种方式是可以量化的,但是对于我们要提取匹配的结果来说就不是很方便了,因此就有了process模块。
用于处理备选答案有限的情况,返回模糊匹配的字符串和相似度。
类似于爬虫中select,返回的是列表,其中会包含很多匹配的数据
choices = ["河南省", "郑州市", "湖北省", "武汉市"]process.extract("郑州", choices, limit=2)> [('郑州市', 90), ('河南省', 0)]# extract之后的数据类型是列表,即使limit=1,最后还是列表,注意和下面extractOne的区别
如果要提取匹配度最大的结果,可以使用extractOne,注意这里返回的是 元组 类型, 还有就是匹配度最大的结果不一定是我们想要的数据,可以通过下面的示例和两个实战应用体会一下
process.extractOne("郑州", choices)> ('郑州市', 90)process.extractOne("北京", choices)> ('湖北省', 45)
这里举两个实战应用的小例子,第一个是公司名称字段的模糊匹配,第二个是省市字段的模糊匹配
数据及待匹配的数据样式如下:自己获取到的数据字段的名称很简洁,并不是公司的全称,因此需要进行两个字段的合并
直接将代码封装为函数,主要是为了方便日后的调用,这里参数设置的比较详细,执行结果如下:
① 第一个参数df_1是自己获取的欲合并的左侧数据(这里是data变量);
② 第二个参数df_2是待匹配的欲合并的右侧数据(这里是company变量);
③ 第三个参数key1是df_1中要处理的字段名称(这里是data变量里的‘公司名称’字段)
④ 第四个参数key2是df_2中要匹配的字段名称(这里是company变量里的‘公司名称’字段)
⑤ 第五个参数threshold是设定提取结果匹配度的标准。注意这里就是对extractOne方法的完善,提取到的最大匹配度的结果并不一定是我们需要的,所以需要设定一个阈值来评判,这个值就为90,只有是大于等于90,这个匹配结果我们才可以接受
⑥ 第六个参数,默认参数就是只返回两个匹配成功的结果
⑦ 返回值:为df_1添加‘matches’字段后的新的DataFrame数据
第一部分代码如下,可以参考上面讲解process.extract方法,这里就是直接使用,所以返回的结果m就是列表中嵌套元祖的数据格式,样式为: [(‘郑州市’, 90), (‘河南省’, 0)],因此第一次写入到’matches’字段中的数据也就是这种格式
注意,注意: 元祖中的第一个是匹配成功的字符串,第二个就是设置的threshold参数比对的数字对象
s = df_2[key2].tolist()m = df_1[key1].apply(lambda x: process.extract(x, s, limit=limit))df_1['matches'] = m
第二部分的核心代码如下,有了上面的梳理,明确了‘matches’字段中的数据类型,然后就是进行数据的提取了,需要处理的部分有两点需要注意的:
① 提取匹配成功的字符串,并对阈值小于90的数据填充空值
② 最后把数据添加到‘matches’字段
m2 = df_1['matches'].apply(lambda x: [i[0] for i in x if i[1] >= threshold][0] if len([i[0] for i in x if i[1] >= threshold]) > 0 else '')#要理解第一个‘matches’字段返回的数据类型是什么样子的,就不难理解这行代码了#参考一下这个格式:[('郑州市', 90), ('河南省', 0)]df_1['matches'] = m2return df_1
3.2 省份字段模糊匹配
自己的数据和待匹配的数据背景介绍中已经有图片显示了,上面也已经封装了模糊匹配的函数,这里直接调用上面的函数,输入相应的参数即可,代码以及执行结果如下:

数据处理完成,经过封装后的函数可以直接放在自己自定义的模块名文件下面,以后可以方便直接导入函数名即可,可以参考将自定义常用的一些函数封装成可以直接调用的模块方法。
#模糊匹配def fuzzy_merge(df_1, df_2, key1, key2, threshold=90, limit=2):""":param df_1: the left table to join:param df_2: the right table to join:param key1: key column of the left table:param key2: key column of the right table:param threshold: how close the matches should be to return a match, based on Levenshtein distance:param limit: the amount of matches that will get returned, these are sorted high to low:return: dataframe with boths keys and matches"""s = df_2[key2].tolist()m = df_1[key1].apply(lambda x: process.extract(x, s, limit=limit))df_1['matches'] = mm2 = df_1['matches'].apply(lambda x: [i[0] for i in x if i[1] >= threshold][0] if len([i[0] for i in x if i[1] >= threshold]) > 0 else '')df_1['matches'] = m2return df_1from fuzzywuzzy import fuzzfrom fuzzywuzzy import processdf = fuzzy_merge(data, company, '公司名称', '公司名称', threshold=90)df
转自:https://mp.weixin.qq.com/s/NU7cHq0nMDzcRHkjI2eEZg
代码补全在开发过程中是非常必要的能力,我们最常用的是 IDE 自带的代码补全功能,但问题在于,IDE 并不能理解我们的代码,推荐总是不那么准确。
今天笔者介绍一个国产代码补全神器 aiXcoder,它现在的离线版已经支持 Java 和 Python 了。对比 PyCharm 原生代码补全体验,它的效果实在是太好了。

图注:aiXcoder 代码补全实测,整行代码预测用起来特别炫酷,整体上比 IDE 的预测准很多
PyCharm IDE 对比 aiXcoder
如果装上 aiXcoder,PyCharm 上的补全效果提升还是挺明显的,但是为了更直观地展示出来,我们可以统计编写同一段代码,敲键数到底有什么不同。
就下面这一段代码,笔者用 PyCharm IDE 的原生推荐,一共敲击了 96 个字符,其中字符串还没计算在内。

如果安装上了 aiXcoder,效果就像文章前面的动图,总共只需要敲击 36个字符(字符串不计入),效果提升特别明显。
至于为什么能节省这么多功夫,看看aiXcoder下面两个预测就知道了。
一次性将变量名、API、参数传入都帮我们写好了,直接预测整行代码:

整个列表推导式的内部逻辑,一次性都预测好了,只要填上参数:

本地补全引擎:确保代码安全
之前笔者也用过代码补全插件,但是它们大部分都要上传代码到服务器,这就比较劝退了。不过 aiXcoder最新发布的 2.5 本地版,完全在本地计算机上运行,不会上传任何代码。
为了验证是不是全部计算都在本地完成,我特意关闭了网络连接,看看它对同一段代码的预测是不是正常,结果是,关不关网络连接,预测都是一样的。
另外,在笔记本上用,我还是比较在意性能的,在测试插件的时候,特别关注了它消耗的计算资源。打开进程管理器,一边写一边观察 CPU 占比。基本键入代码的过程中 CPU 占比在10%吧,停止键入很快就降到0了。

虽然代码预测都放到本地了,但是 aiXcoder提供了下面这种滚动条,来平衡「补全能力」和「计算性能」之间的关系。试了一下,越靠近「Faster」,表示会尽快返回预测结果;越靠近「Longer」,表示插件将反馈更好的预测结果。

插件市场,安装便捷
aiXcoder 2.5 目前支持 Java 和 Python,它们都可以在 JetBrains 市场上直接下载与安装。即在 IntelliJ IDEA 的市场上,可直接下载 aiXcoder用于 Java 代码补全。同理在 PyCharm 市场上,也可以直接下载 aiXcoder用于 Python 代码补全。
在 PyCharm 上,下面三步即可完成安装:

与之前一样,Python 插件安装后,它会自动下载服务端,只需要等十几秒,就能快速用上。反正笔者已经愉快地用上了,小伙伴们也来试试呀。
最后,更多语言与 IDE 支持可查阅下载页面:
https://www.aixcoder.com/#/Download
转自:https://mp.weixin.qq.com/s/MNK0I6xKJ837S6w2CrZ0gA
沪漂小许最近的心情真的是坐过山车一样。
住在宝山的他,有一辆挂着外地车牌的小轿车,每天从家里开车去大宁上班。有时候领导让他去市中心办点事,高架、内环内随便开,只要下午三点前开回普通地面道路就行。

结果上个月末,上海交警的新规,打他了个措手不及:从2020年11月2日起,外地车牌的限行时间调整为工作日的7时至20时。

也就是说,小许一整个白天都不能开车上市区的主要高架、隧道、大桥了,对他来说最重要的南北高架,呼玛路至鲁班立交段都不能上,那可怎么上班?
那辆外牌车,于小许而言,突然就变成了一堆可移动的废铁。
昼伏夜出?你当我是夜猫子啊。
不仅如此,从明年五一小长假后开始,工作日的7-10点、16-19点,内环内再也不许外地车开了。
小许一周最起码需要去2-3次内环拜访客户,这下明年五一后,早于早上十点、晚于下午四点,内环也不能开了,难道内环内这么多大公司都得搬出来?
岂有此理!
上海有高达167万辆外地车,占全市保有量的三分之一,新政大大的影响了着一大批车主的出行。

于是上周,小许就拉着我给他出出主意。我想了想,无非就是拍牌和买新能源车。
作为典型的沪漂,小许的社保交了两年不到,但拍牌需要连续3年的社保记录,等待太久了。而且新规一出,代拍的黄牛乐开了花:想要拍牌的人突然多了好几倍!
又要9万多的价格,又只有10%左右的中签率,小许只能灰心放弃。

那第二条路就是去买新能源车了。
开惯了汽油车的小许对于纯电动车的续航里程还是有点焦虑,所以就拉我跟他一起去商场看了可以加油的插混车,送沪牌,不限行,6个座位,30万出头落地,看上去很香。

但销售小姐姐的一番话让他打了退堂鼓。
社保有12个月没有?有了。
充电桩有吗?这…
新能源车上牌,需要固定车位的充电桩,而小许所在的楼盘,只有业主才有资格拥有固定车位,小许才刚来上海两年,根本不满足五年社保家庭才能买房的条件。
没交满五年社保就不能买房 → 没买房就没有固定车位 → 没固定车位就没有充电桩 → 没充电桩就不能买新能源车 → 没有新能源车就不能开车上班。
咱们沪漂人,这也太惨了吧。

实在没辙的小许,接下来要尽量避开高架和内环,开始每天堵在地面上的生活,要么,只能去租一辆不限行的车,这又是一笔不小的开销。
小许的遭遇只是众多外地人来上海拼搏的一个缩影,沪漂们的九九八十一难,真是说也说不过来。
最明显的,就是户口问题。
目前,上海落户一般有6大类:
每年,上海落户人数在11-13万人左右,其中,像小许这种通过就业、社保的居转户和人才引进,每年只有4.5万人左右。
其中,每年人才引进基本占三分之一,也就是1.5万人左右,而且看看落户的名单,都是些什么“神仙公司”:

人才引进要看公司甚至所在的区有没有名额,像浦东一个区(含临港)基本会占掉40%的名额,剩下的15个区瓜分其余的60%,真是难上加难。
而居转户的名额,每个月也就2000人左右,更是一关接着一关,居住证年限要满足7年,学历、职称要有一定标准,工资、社保和个税也要达标,一切都搞定后,由于落户总量有限制,接下来就是排队与等待。
户口的重要性,相信沪漂们都懂。
办理港澳通行证、台湾通行证、护照更换身份证、办理临时身份证……外地户籍虽然也能在上海办理,但办理时间会慢一些,若是上海户口,办证会方便很多。
上海户口的个人可以办理社保,非沪籍只能公司办理社保,自由职业的沪漂们很烦心。
上海户口的小孩可以办理少儿医保,非沪籍小孩需父母一方有上海居住证且积分120分才可以办理。
而上海户口的优势,在买房上展现得淋漓尽致。
小孩上学,就算你买了学区房,要是没户口,还是排在人家人户一致的家庭后面。
外地户口,单身是吧?不好意思,无论交多少年社保都没有购房资格,只有落户才行。而租房子的麻烦,我们都懂。

外地户口,结婚了是吧?不好意思,整个家庭也只能买一套。如果你想一套自住一套学区,想都不用想;如果你要置换,抱歉,只能先把手头上的房子卖了,才能腾出名额买下一套。
先卖后买,在目前的上海楼市是非常危险的。你看上的房子,地段、品质、学区更好,往往是领涨的龙头,你在卖掉原来房子之前,没法提前锁定目标房源的价格,而且你的目标房源往往涨的比你现在持有的房子要多,这过程非常痛苦。
胆子大一些的,先把定金交了,一旦原来的房子短时间内不能以合适的价格出售,就面临违约风险,只能打骨折售出,损失颇大。
缺乏了买卖房子的灵活性,这在置换过程中会非常被动。笋盘,就是这么来的~
沪漂们落户上海的艰难,我们都懂。但我一直相信,只要足够努力,变得足够优秀,对于我们艰苦奋斗的打工人来说,那都不是事儿!

举个例子,对于沪牌,就算是上海本地人,其实也拿他没办法,10%左右的中签率,差不多一辆车的拍卖价格,使得不少上海本地人也开着赣E、浙D、苏F甚至黑C拍照的车,在高架下“望路兴叹”。
实在因为运气问题拍不到,还有15万一块的公司牌,价格者得,童叟无欺。

你看,其实能不能拿到沪牌,和出身关系不大,更看重的是努力程度。
买房也是如此,进大单位走人才落户,双一流毕业走应届生落户,甚至创业成立公司,投资到一定数额,无论是以公司名义买还是以落户高管身份买,都不是问题。
问题是,我们足够优秀吗?
反观上海本地人,至今还有大量的“老上海”蜗居在市中心的棚户区和老破小中,上海户口除了给他们带来了一口流利的上海话外,好像并没有什么优势。有房票,买不起,能拍车牌,也拍不起。

而足够努力、足够优秀的新上海人,则已经在上海新房市场里大杀四方,9万+的静安映,10万+的鑫耀中城,310打头的上海人占比已经不足三分之一,另外三分之二都被外地人“后来居上”。

而更厉害的外地人——李佳琦们,不仅在上海买了房,还通过自己的努力,把成千上万的上海人变成了“尾款人”。

沪漂们,你愿意做哪一种呢?
转自:https://mp.weixin.qq.com/s/AcK95V7b17ukTCUlTHJo0A