微信的原创保护机制到底是如何实现的?

前言

众所周知,目前微信公众号是最具商业价值的写作平台,这与它优秀的原创保护机制密不可分,如果你想将其他公众号上的文章标为原创,微信会给出类似如下的信息告诉你未通过原创校验逻辑。

微信的原创保护机制到底是如何实现的?

如果你抓包会发现微信返回了如下错误

微信的原创保护机制到底是如何实现的?

如果你想改几个字蒙混过关,对不起,不行!依然会报上述错误,这得益于微信原创检测机制所采用的 simhash 技术,它是 Google 为了解决大规模的网页去重而发明的算法,广泛用在大规模的文章,评论判重等地方,效率极高,那么这项技术是如何实现的呢,通过上面的错误信息不难发现微信是为每篇文章生成了一个指纹(fingerprint),最终文章相似性的比较其实是指纹的比较,那么这个指纹又是如何生成的呢,本文将会为你由浅入深地揭晓 simhash 的秘密。

本文的目录结构如下:

  • 传统 Hash 与其局限性
  • 余弦定理实现及其局限性
  • 基于随机投影来实现空间向量的降维
  • simhash 原理及实现

传统 Hash 与其局限性

如何比较两篇文章是否相同,相信大家不难想到以下步骤

  1. 通过一个 Hash 函数(MD5 等)将文章转成定长字符串,比如 32 位
  2. 比较上一步生成的定长字符串是否相等

第一步的主要作用是将大范围映射到小范围,这样使用小范围的定长字符串「一般我们把它称为指纹(fingerprint)」大大缩小了空间,更利于保存,并且更利于比较,但对于计算两篇文章的相似度传统 hash 就无能为力了,因为对于传统 hash 来说,它要求随机性足够好,也就是说对于两个输入字符串,哪怕只有一个字母不同,使用传统 hash 的输出结果也是大不相同。

微信的原创保护机制到底是如何实现的?

如图示,以 SHA1为例,两个字符串「我是中国人」与「我是中国人啊」只相差了一个字,但输出的结果完全不同,根本没法比较,退一步来说,就算要比较,每个 hash 结果也要一个字符一个字符的比,性能极差!

所以我们需要找到这样的一个 hash 函数,它需要满足两个条件

  1. 可以实现局部相似性
  2. 生成的 hash 结果利于比较

先来看第二点,要让 hash 结果利于比较,可以将结果转化为仅由 0,1组成的定长二进制数字,这样只要将结果进行异或运算,算出结果有几位 1 即可,simhash 就是这么做的

微信的原创保护机制到底是如何实现的?

如图示:将结果进行异或运算后只有两位为 1,即只有两位是不一样的

接下来我们再来看第一个问题,simhash 如何输出局部相似性的结果, 它的计算过程与利用余弦定理来计算文本相似度有一定的相似性,可以认为是余弦定理的一个演变,所以我们先来看看如何用余弦定理来计算两者的相似度

余弦定理

第一次听说余弦定理是在吴军的<<数学之美>>里看到的,通过余弦可以判断两篇文章是否相似,步骤都是类似的,将文章转化为 n 个维度的空间向量,再计算这两个空间向量的在空间中的夹角,我们以下两个文本为例来看看如何利用余弦定理来计算这两个文本的相似度(本例子来自阮一峰博客)

句子A:我喜欢看电视,不喜欢看电影。
句子B:我不喜欢看电视,也不喜欢看电影。

步骤一:分词

句子A:我/喜欢/看/电视,不/喜欢/看/电影。
句子B:我/不/喜欢/看/电视,也/不/喜欢/看/电影。

第二步,列出所有的关键词。

我,喜欢,看,电视,电影,不,也。

画外音:使用 TF-IDF 算法来算出所有的关键词,像 「的」,「地」,「得」这种无意义的顿词需要去掉

第三步,计算词频。

句子A:我 1,喜欢 2,看 2,电视 1,电影 1,不 1,也 0。

句子B:我 1,喜欢 2,看 2,电视 1,电影 1,不 2,也 1。

第四步,写出词频向量。

句子A:[1, 2, 2, 1, 1, 1, 0]

句子B:[1, 2, 2, 1, 1, 2, 1]

注:这里为了演示方便简单用出现的次数来作为词频向量,实际上生产上一般不会这么干,一般会利用 TF-IDF 算法来生成词频向量,本文不作展开,感兴趣的读者可以自行研究

于是问题表现为了如何在空间中计算这两个向量的相似度了,我们可以把这两个向量认为是两条线段,从原点[0, 0, xxx],指向这两点的线段,这两个线段形成了一个夹角,夹角越小,说明这两个向量越相似,如何知道这两个夹角的大小呢,计算它们的余弦值(cosθ)即可,如果值越接近 1, 说明 θ 越小,两个向量就越接近,文本也就越相似

微信的原创保护机制到底是如何实现的?

于是问题转化为了如何计算 cosθ 的值,回忆下大学的数据公式,其值计算如下微信的原创保护机制到底是如何实现的?

于是我们可以根据以上公式计算出句子 A 和句子 B 的 cosθ 值为:

微信的原创保护机制到底是如何实现的?

高达 93.8% 的相似度!这与实际情况吻合,既然使用余弦定理就可以计算文章的相似性,那为啥还要搞出 simhash 这样的算法呢,细心的朋友不难发现它的缺点,计算余弦的过程涉及到很多的乘法开方等计算,n 个分词最终转化后就是 n 维向量,一篇文章的分词是非常多的,也就意味着这个 n 是非常大的,所以计算余弦是非常耗时的,肯定无法应用于 Google 这样需要海量网页判重的场景。

由此分析可知余弘定理计算主要性能瓶颈在于文章转化后的高维度向量,高维度所需的计算量较复杂,那能否考虑降维呢,即把 n 维降低到 k 维(k 远小于 n)甚至是一维,维度越小,计算量就越小,接下来我们就来看看如何利用随机投影实现数据降维。

基于随机投影来实现空间向量的降维

向量点积含义

随机投影的基础方法,是向量点积运算。所以理解随机投影的基础,是理解向量点积运算的含义。

设二维空间内有两个向量,则其点积(也叫内积)定义为以下实数:

微信的原创保护机制到底是如何实现的?

点积运算

表示的是两个投影积,一个是

上的投影长度:

微信的原创保护机制到底是如何实现的?

一个是 OB 在其本身的投影长则为 |OB|,

如果我们把

看作是新空间的坐标轴,那么点 A 在新空间的坐标是

微信的原创保护机制到底是如何实现的?

假设有如下两个向量微信的原创保护机制到底是如何实现的?

那么点 A 以向量

所在直线为坐标轴的空间中,坐标为 a.b=7*1+3* (-1)=4,发现了吗,此时点 A 在新空间中的坐标由 2 维降到了 1 维,实际上向量点积不光可以实现二维降一维,也可以实现从 M 维降到 K  维。只要基于高斯分布(即正态分布),在原向量空间中找到一个 k 维向量

微信的原创保护机制到底是如何实现的?

就可以让原来任意一个在 M 维空间的向量 M 通过点积 M  ⋅ R 将其降维到 K 维,Johnson–Lindenstrauss 引理指出:在欧式空间中的若干点,经过相同的映射后进入新的空间,它们仍然会保持原来的相对位置,也就是说原来向量之间的夹角在向量降维映射到新空间后依然可以认为基本不变,这也就意味着降维后不会对文本的相似度计算产生影响

随机投影降维离散化—-基于随机投影的局部敏感哈希

通过随机投影法,确实实现了高维度降到低维度的目标,但降维后生成的向量坐标很可能是 float 型的,不利于存储,而且在计算比如余弦时,需要 float * float 的计算,我们知道浮点型计算是比较耗性能的,所以有人就提出能否对这些 float 的连续型坐标离散化,这样就解决了存储,计算的难点。

在将数据映射到降维后的新空间后,我们将落在坐标轴负轴的维度(该维度取值为负数),统一赋值为 0(或者 -1,使用 -1 的话 是将映射后的词语放置在整个空间中,而不是某一个象限,这样可以让数据点分布得更均匀一点),表示数据与对应随机向量夹角大于 90 度。类似的,我们将落在坐标轴非负轴的维度,统一赋值为 1。这样原始数据就被映射到了一个离散的新空间里。

这种离散化的数据映射方法,就是我们常说的基于随机投影的局部敏感哈希,经过离散化后,原来在空间中接近的数据点依然是相似或相同的,更重要的是经过离散化后转化为了 0,1 二进制数字,计算速度大大提高!

基于随机投影的局部敏感哈希,也是随机投影 hash 的一种,通过上述映射规则,将原空间向量进行了离散化降维

随机超平面 hash

知道了什么是基于随机投影的局部敏感哈希, 也就不难理解随机超平面 hash 了,它也是随机投影 hash 离散化的变种,对于一个 n 维向量 v,如果要得到一个由 0,1 组成的 f 位签名(f  远小于 n),它的算法如下:

  1. 随机产生 f 个 n 维的向量 r1,…rf;
  2. 对每一个向量 ri,如果 v 与 ri 的点积大于 0(说明在此向量划分的空间是相似的),则最终签名的第 i 位为 1,否则为 0。

这个算法相当于随机产生了 f 个 n 维超平面,每个超平面将向量 v 所在的空间一分为二,v 在这个超平面上方则得到一个 1,否则得到一个 0,然后将得到的 f 个 0 或 1 组合起来成为一个 f 维的签名

微信的原创保护机制到底是如何实现的?如图所示,随机在空间里划几个超平面,就可以把数据分到不同空间里,比如中间这个小三角的区域就可以赋值为110

每个降维后的 f 维签名,就是文章的最终签名!通过这样的解释相信大家不难理解通过异或比较位数的不同来判断文章的相似度的几何意义:位数不同,代表其在相应超平面上不相似

simhash 原理及实现

为啥前面花这么大力气介绍引出随机超平面 hash 呢,因为 simhash 就是基于超平面 hash 演变而来的,可以说理解了超平面 hash 也就理解了 simhash,接下来我们看看 simhash 的生成流程:

simhash 的生成划分为五个步骤:分词->hash->加权->合并->降维

  1. 分词:  这一步可以余弦定理的 1~4 步类似,首先,判断文本分词,形成这个文章的特征单词。然后,形成去掉噪音词的单词序列。最后,为每个分词加上权重。我们假设权重分为5个级别(1~5),比如:“ 美国“51区”雇员称内部有9架飞碟,曾看见灰色外星人 ” ==> 分词后为 “ 美国(4) 51区(5) 雇员(3) 称(1) 内部(2) 有(1) 9架(3) 飞碟(5) 曾(1) 看见(3) 灰色(4) 外星人(5)”,括号里是代表单词在整个句子里重要程度,数字越大越重要,为了方便解释,以下我们假设文档只有「美国」和「51区」这两个分词。

  2. hash: 通过 hash 算法把每个词变成 hash 值,比如“美国”通过 hash 算法计算为 100101,“51区”通过 hash 算法计算为 101011。这样,我们的字符串就变成了一串串数字,此 hash 值我们称为这些词对应的独热编码,然后再将 0 转为 -1,这样美国的「100101」编码为了「1-1-11-11」,51区的编码为「1-11-111」,将 0 转为 -1 的目的是将映射后的词语放置在整个空间中,而不是某一个象限,这样可以让数据点分布得更均匀一点,与随机超平面hash相比,这里使用了一个“不随机”的超平面,将空间进行了分割。

  3. 加权: 通过 2 步骤的 hash 生成结果,需要按照单词的权重形成加权数字串,比如「美国」的hash值为「1-1-11-11」,通过加权(权重参见步骤一得出的各个词语的权重值)计算(相乘)为「4 -4 -4 4 -4 4」;「51区」的 hash 值为「1-11-111」,通过加权计算为 「5 -5 5 -5 5 5」,得到的各向量即表征了这个文档

  4. 合并: 把上面各个单词算出来的序列值累加,变成只有一个序列串。比如 “美国”的 “4 -4 -4 4 -4 4”,“51区”的 “ 5 -5 5 -5 5 5”, 把每一位进行累加, “4+5 -4+-5 -4+5 4+-5 -4+5 4+5” ==》 “9 -9 1 -1 1 9”。

  5. 降维: 把第 4 步算出来的 「9 -9 1 -1 1 9」变成 0 1 串,形成我们最终的 simhash 签名。如果每一位大于 0 记为 1,小于 0 记为 0。最后算出结果为:「1 0 1 0 1 1」,这里采用了随机超平面 hash 的离散化方法,得到文本的最终表示

相信细心的你不难发现在第二步和第五步可以看到随机超平面的身影,也就是说并没有产生直接的随机超平面向量来映射,是间接产生的,如果想找到直接的超平面向量 R 来生成最后的签名也不难,我们就假设文档只有「美国」,「51区」这两个特征词,由第一,二步可知其文档向量为 d = (4, 5),hash 后的编码为 100101,101011,我们注意到第二步hash会做一层编码转换, 1 不变, 0 转为 -1

 100101  ----> 1-1-11-11
 101011  ----> 1-11-111

再用逗号隔开,使其成为了特征词对应的映射向量

「美国」对应的映射向量:(1, -1, -1, 1, -1, 1)
「51区」对应的映射向量:(1, -1, 1, -1, 1, 1)

再把上述每个特征词对应向量的第 i 位取出来组成 ri 向量,如下

r1 = (1, 1), r2 = (-1, -1), r3 = (-1, 1),  r4 = (1, -1), r5 = (-1, 1), r6 = (1, 1)

再回顾下随机 hash 超平面算法的第二步:

 对每一个向量 ri,如果 v 与 ri 的点积大于 0,则最终签名的第 i 位为 1,否则为 0。

将文档向量 d = (4, 5) 与上述 r1…r5 每一个向量相乘,可得结果为

(9, -9, 1, -1, 1, 9)  ---->   (1 , 0, 1, 0, 1, 1)

与 simhash 生成的完全一致!所以我们说 simhash 是从超平面 hash 算法演变更来的。

一般 simhash 生成的签名为 64 位,只要两个签名不同的位数少于等于 3 位我们就认为两个文章相似,这种使用不同进制位个数来计算两者差异的方式我们也叫汉明距离

simhash 查询优化

生成了 64 位的签名,然后就通过计算签名的异或来查询文章的相似度吗?too young too naive! 对于 Google 网页去重来说,可能会有几十亿的网页内容,那每次判重都需要使用签名进行几十亿的异或比较,这谁顶得住啊,那该如何优化呢?答案是利用抽屉原理进行优化存储。

什么是抽屉原理?把三个苹果放进四个抽屉里,必然有一个是空的

我们注意到判断文章相似的条件 ,对于签名为 64 位的 simhash 签名,只要位数少于等于 3 位即可判断为相似,这样的话我们可以把 64 位的签名分成四份,每份 16 位,如果相似,那必然有一份是完全相同的。

微信的原创保护机制到底是如何实现的?

我们可以把签名用 K-V 的形式进行存储, K 为其中的一部分,V 为剩余的 3 部分,先比较 K 是否精确匹配相同,如果匹配,再比较 V 部分的相似度,那么这四部分哪一部分应该为 K 呢,由于我们不知道哪一部分是精确匹配的,所以每一部分都应该为 K,剩余的部分为 V,以文本 1 为例,它应该设计成如下方式进行存储,这样保证不会有遗漏

微信的原创保护机制到底是如何实现的?

以下是查询库

微信的原创保护机制到底是如何实现的?

那么用这样的方式来存储到底提升了多少速度,我们一起来算笔帐。

假设数据库中有 2^30 条数据,也就是差不多 10 亿条数据:

  • 如果不用抽屉原理,则需要进行 10 亿次的比较
  • 如果使用抽屉原理
    • 首先先进行 K 的比较,由于是 K-V 也就是 hash 存储,所以 K 比较时间复杂度是 0(1),可以忽略不计,
    • K 如果精确匹配,把所有对应的 V 取出来即可,那么 V 可能有多少数据?因为 K 最多可能有 2^16位,所以 V 最多有 2^(30-16) = 2^14 位,
    • 由于最多进行 4 次 K 的比较,所以最多会进行 4 * 2^14 = 65536,约 6 万次比较

可以看到利用抽屉原理比较次数从 10 亿次降到了 6 万次!查询性能大大提升,当然了天下没有免费的午餐,由于数据复制了四份,存储空间也增大了 4 倍,这就是典型的以空间换时间。

simhash 缺点

simhash 比较适合海量长文上,短文本准确度上不高,因为用来度量长文本相似的汉明距离阈值为 3,但是短文本中,相似文本之间的汉明距离通常是大于 3 的。

所以你会发现在公众号后台如果你要标原创,字数必须大于 300,也是这个原因

微信的原创保护机制到底是如何实现的?

总结

理解 simhash 的关键在于理解超平面随机 hash,使用它可以实现向量从高维度到低维度的降维。网上有很多讲 simhash 的的文章,但大多把降维这个具体过程给跳过了,看得是让人一头雾头,所以笔者查阅了大量资料希望能帮助大家理解这一流程,希望大家能有收获,如果想对 simhash 有更深入的理解,可以查阅文末一堆的参考链接,都非常棒!

巨人的肩膀

  • https://www.cnblogs.com/shaosks/p/9121774.html
  • 局部敏感哈希算法及其思想的讨论:https://my.oschina.net/u/4367429/blog/3261406
  • http://www.ruanyifeng.com/blog/2013/03/cosine_similarity.html
  • https://zhuanlan.zhihu.com/p/81026564
  • http://www.hanting.tech/2017/05/23/simhash.html
  • https://zhuanlan.zhihu.com/p/92155250
  • https://blog.csdn.net/sunny_ss12/article/details/46949315
  • https://cloud.tencent.com/developer/article/1189493
  • https://www.cnblogs.com/sddai/p/10088007.html
  • 彻底弄懂LSH之simHash算法: https://www.cnblogs.com/hxsyl/p/4518506.html
  • 海量短文本场景下的去重算法:https://www.iyunying.org/seo/dataanalysis/152232.html
  • 海量数据相似度计算之simhash和海明距离: https://cloud.tencent.com/developer/article/1390215

 

·END·

来源:码海

版权申明:内容来源网络,版权归原创者所有。除非无法确认,我们都会标明作者及出处,如有侵权烦请告知,我们会立即删除并表示歉意。谢谢!

转自:https://mp.weixin.qq.com/s/kAEEmHA_3NzYg_5AmjEiVA

2021上海高考数学英语平均分、最高分!

 

 

今天给大家分享一下2021年上海高考数学和英语学科的得分统计详情包括最高分、平均分、中位分等等。数据来源升学有道,供大家参考!

 

 

数 学

 

统计的有效人数为39749人,并非全部考生。该样本数量下,数学平均分为105.37分,最高分自然是150分。
2021上海高考数学英语平均分、最高分!
关于四分位数,其实就是118分及以上对应前25%,106-118分对应前50%,93-106分对应前75%。
除了上述的整体统计,还有分层级和分类别统计结果。
2021上海高考数学英语平均分、最高分!
分类别统计结果中,区重点高中的数学最高分为148分,一般高中最高则为142分高考数学想拿到满分150分,难度还是相当大的。

 

英 语

 

上海高考英语有两次机会,两次都参加,取最高成绩计入高考总分。如果参加1月份的外语一考并且取得不错的成绩,能极大缓解高三下学期的复习压力。
2021上海高考数学英语平均分、最高分!
根据有效样本统计结果:
 
1月:最高分147分,均分94.17
6月:最高分143分,均分96.96
最终:最高分147分,均分100.37

 

 

附各类型学校描述性统计结果:
 
2021上海高考数学英语平均分、最高分!
2021上海高考数学英语平均分、最高分!

转自:https://mp.weixin.qq.com/s/jzB3-QjEvEtphlyUwAiw0w

如何度过人生最阴暗的时刻?

作者 | 良大大
来源 | 良大
(ID:liang_da_shi)
个人微信号:liangshu0009(不闲聊)

如何度过人生最阴暗的时刻?

Hi~,我是良大。

有读者私信给我,说自己跌到了人生低谷,处在最阴暗的时刻,问我有没有这样的经历,如果有,是怎么度过的?

 

借着这个话题,咱们简单的聊聊。









1













不要自怜

芒格曾经说过,人类所有的情绪都是有用的,唯独“自怜”没用,而且有害。

老读者应该看过我不少的早年经历,其实挺苦逼的,但是我很少用悲催的言语来描述,都是带着几分调侃,就是不想落入“自怜”的套套里。

人在不顺时,特别容易自怜,抒发命运不济,感慨时运不公,倘若是一位天才诗人,也许能激发一句“奈何青云士,弃我如尘埃”的诗句。

但是,对于普通人,“自怜”只会把自己变得脆弱,让潜意识也认可自己是个倒霉蛋。

“你用什么来形容自己,你终究会变成什么样子。”这话说起来有点鸡汤,但是诺贝尔得主卡尼曼曾用实验证明这句鸡汤的正确性。

你要相信,所有的标签都是你自己打给自己的。

我看过很多名人传记,他们人生中肯定不少波澜曲折,但是几乎没人用“阴暗时刻”来形容,也许在他们眼中,那都不算什么,只是一种正常波动。

反而是媒体和大众过分解读了,每每还会配上“你内心要强大到不可思议”这样的金句,这种说法一定会让这些名人觉得矫情。

芒格每当遇到有人说了自怜的话,他就会写一个纸条递给对方,上面写着:

“你的故事让我很感动,我从来没有听过还有像你这么倒霉的人。”

芒格在很多公开场合讲过这个段子,他说:

“不要陷入自怜的情绪当中,请保持‘精神卫生’”。

所以,不要给岁月特殊的定义,阴晴圆缺都是一种正常波动,别稍有不顺就当成是“阴暗时刻”,不要主动培养自己对挫折的嗅觉。

 









2













事儿上见

当然,我不否认,人生有些阶段确实会特别的痛苦。

2000年我刚刚来深圳时,拿着个二本文凭,3个月都没找到工作,钱也花的差不多了,迷茫的不得了。

在内地的女朋友也和我分了手,就在这个时候,家里又出了事儿,摊上了官司,有人进去了,还要赔十几万,这在当时可不是个小数目啊。

一个刚刚大学毕业的毛头小伙,要扛这么多的事儿,压力能不大吗?

那时每天晚上快要睡着时,就感觉心里堵了块石头,呼吸困难,四肢僵硬,还去医院看了,医生说这叫“濒死感”,是抑郁症的前兆,让我一定要注意。

后来我并没有患上抑郁症,甚至可以说,我是一个心理极其健康的人。

当时我就明白一个诀窍,要想不迷茫,一定要“事儿上见”,这不是北方话的常用意思,而是说,你一定要做很多具体的事儿来填充自己。

你如果对大脑的机能有点了解就知道,人的思维就像是一滩随意流动的水,很难人为控制,负面情绪就像一个个小小的漩涡,会把你的思维卷进去,你的思维也开始变得悲观和狭隘。

而当你在做具体的事儿时,就能避免这种情况。

因为,但凡你要动手做一件事,总要有个目标吧,总要去想用什么手段去达成这个目标吧?

这么一来,你的思维就会附着在具体的事儿,通过一条条管道,你的思维就收敛了,那滩水也就不会四处乱溢了。

我在那个时候,就是去读夜校,学英语、法律,还去做义工,每件事都有目标,有反馈,也就消解了压力和烦恼。

后来从500强裸辞创业,一开始很不顺利,我就开始写文章、学手绘,也都是希望“事儿上见”,这也帮我度过了不太顺利的日子。

只是,在选择的事情上,最好选择你觉得有价值的事儿,而不是只为让自己摆脱当下的事儿,比如,玩游戏,虽然让你暂时愉悦,但是玩完你会觉得更空虚。

总之,一句话总结,就是让自己为有意义的事儿而忙碌,在这个状态下的人,基本上都拥有粗壮的神经和高亢的心态。

 









3













依靠自己

很多人都一直在等着被别人拯救,总觉得有个白胡子老头,会在人生的某个阶段等我们,点拨我们从此走上巅峰。

这就是为什么,很多人花几万块,去上一些莫名其妙的课程。

不过可惜的是,这个白胡子老头永远不会出现的,所有的一切都要你自己挨。

我曾和一些准备创业的人聊过,很多人说自己有很好的构想,就是缺两个合伙人,一个懂技术的,一个懂市场。

我说:“创业初期,就是技术+市场,那你干啥?”

他说:“我统领大方向。”

这种创业者肯定没戏,因为他把希望都押宝在别人身上,人家懂技术和懂市场的为啥要找你呢?

前段时间,我去参加一个短视频沙龙,很多人想做口播类短视频,但是又不想自己出镜,其中一位更奇葩,她想做亲子教育类的,自己不想出镜,准备让孩子出镜。

我问她:“你都不想出镜,为啥觉得你孩子想出镜呢?”

她说:“我可以命令他出镜啊….”

其实,这类人很多,想干什么事儿,总想借助外力,就是不想自己动手,这要是能做成事儿,才邪门呢。

以我这么些年的经历,凡事都必须自己躬身入局才行,都必须自己死磕,这是逃不掉的事。

很多人陷入窘境,就是因为总是等一个贵人或一本秘笈,到最后啥都没来,只是越混越惨。

写过《霸王别姬》的香港作家李碧华,曾说过一句话:

“求人如吞三尺剑,靠人如上九重天。”

李碧华之所以说这句话,是因为她的一个朋友,总把希望放在别人身上,结果东靠西靠,发现全都不靠谱,这世上唯一靠得住的,只能是自己。

同样的,当我们遇到一些很难逾越的坎时,也只能自己爬过去,没人能帮你,不会有贵人,所谓“贵人”,就是当你够“贵”时才会出现的人。

明白这一点,你就会少了一些妄念,多了一些心力,你迈出的每一步才能扎实。

 









4













永远渴望

很多人到了中年就变得灰头土脸,觉得没啥盼头。

说到底,就是失去了“渴望”。

你肯定很诧异,说怎么可能?哪个中年人不渴望赚更多的钱,住更大的房子?

这其实不是“渴望”,而是“欲望”。

欲望就是追求自己想要的东西。

渴望,是摆脱确定性,追求不确定的东西。

你看那些处在青春期的少年,他们没有稳定的状态,一会儿想当歌星,一会儿又想当政治家,他们一直在探索。

所以,啥叫青春?青春就是充满渴望的那个状态。

当我们不再渴望,就是青春死去的标志。

所以, 为啥老说“油腻中年”呢,其实就是只追求自己确定的东西,对于那些不确定的,不在自己认知边界的东西,要么鄙视,要么抗拒,最后就没有了渴望,只有了欲望。

看到这里,你大概也能理解《月亮和六便士》想表达的意思,一位银行家突然放弃了所有,一心一意要去做一名画家,其实就是在表达这种渴望的状态。

顺着这个角度,我们也能重新理解什么叫“更好的自己”,这不是说去年你赚了50万,今年你赚了100万,而是说,你挖掘出了一个不一样的自己。

一个工程师想变成摄影家,一个大厂员工想变成演讲家,一个公务员想变成旅游博主…… 这些都是在变成更好的自己,而这样的人真实存在,我就认识不少。

我不是让你放弃所有,从零开始,而是想建议你一定要抽出一点精力,去做点你认为不太可能的事儿,这个时代越来越奇葩,没啥不可能的事儿。

我37岁时,如果谁告诉我3年后我会成为一名畅销书作家,我一定会让他滚远点,董事长的报告快把我折腾死了…….可谁能想到这还就成真了呢?

所以,中年人啊,如果你感觉很消沉,那八成是欲望太多,而渴望太少了,社会和环境给你订制了一个套子,让你觉得本就应该这样,但有时我们真应该跳出来,反问一句,为啥不能那样呢?

就像曾经年少无知的我们,倔强、叛逆、反传统,但却对这个未知的世界充满渴望。

 









5













以上写的东西,你说是鸡汤也好,说是干货也好,都是我的一点感悟,希望能给你点启发,或者能带给你一点共鸣。

最后想说,没人能一辈子都顺顺当当,不过大家只会秀出光鲜的一面。

我的第二个老板,是做法律咨询的,2000年时身价过千万,住豪宅,开豪车。

走路都呼呼带风,特精英范儿的那种,我觉得人要能活成这样得多舒服啊。

有天晚上我去加班,想顺便收拾一下他的房间,打开灯时,才发现他在里面,满脸的泪水,挺尴尬的。

当时我还想,有这么多钱,还有啥不开心的。

后来,我经济条件变好了,也发现,人生就是由一堆破事组成的,就算你财富增加了,物质丰富了,破事也不会变少,真正能活得通透和洒脱的人没有几个。

只不过和岁月交手多次后,知道了,还是把苟且不堪藏起来好些,说出来没人关心,自己老揣着,也堵的慌,还不如装的很笃定、很洒脱。

网络上有句话说:“吃屎的人生总是相似,咀嚼的态度却各有不同”。

话虽糙了点,但却说出了真相,所谓“态度”就是装出来的一种姿态,只不过这种“装”是有益的,按照“具身认知”的说法,装着装着,别人信了,自己也信了,世界变得和颜悦色,不再阴暗。

 

-END-

 

如何度过人生最阴暗的时刻?

作者简介:良大,投资人,商业顾问。大学时开始各种折腾,卖过贺年卡、摆过带鱼摊、倒腾过服装店。毕业后,开过饭店,当过职业打假人,后来进了500强在总部做管理。有一天,脑袋一热,又出来创业,现在做咨询和培训,空闲时写写文章。

转自:https://mp.weixin.qq.com/s/L57OmaMYapwe38KTDjnV5g

48岁男子活活饿死,成年人的苦你不懂

原创:老雾

来源:雾满拦江(ID:lwwuwuwu)

(01)

 

1971年,一个日本男孩儿,出生在东京地区。

相关资讯,以化名称呼这孩子,叫他孝之。

孝之父母虽不说是大富大贵,但也衣食无忧,给了孝子充足的成长空间。

小时候的孝之,可爱,善良,谁见到他都喜欢。

高中毕业后,他参加了日本海上自卫队。

然后他迷上了划艇比赛,迷上了钓鱼。

48岁男子活活饿死,成年人的苦你不懂

一切表明,孝之是个心理健康的成熟男人,一点也不娘炮。

孝之纯爷们,铁血真汉子。

孝之终于进入社会,摩拳擦掌,要干一番事业。

(02)

孝之工作了,在家大企。

他跟上司处得特别好,可以说是人际交往的高手了。

然后上司就辞职了。

上司辞职,原因不明,可能是另有发展机会,也可能是遭遇职场斗争被排挤。但关系和睦的上司离职,严重影响了孝之,他也干不下去了。

进入职场第五年,孝之黯然离职。

这一年,他26岁。

才26岁,这个年龄受点挫折磨难,不算什么。

所以孝之暂时回爸妈家里,调整一下心情。

他回到爸爸妈妈家里,一天,两天,三天……一年,两年,三年……然后爸爸妈妈吃惊了:这孩子出问题了。

孝之成为宅男。

孝之成为的宅男,和我们日常说的宅男,不是一个概念。

我们日常说的宅男,喜欢居家,打游戏,肥胖,爱喝奶茶,就算宅了。

但我们说的宅法,跟孝之比起来,真的算是高频社交人士了。

孝之的宅法,是躲在自己卧室里,不吭声,不出卧室门,不洗澡,不接电话,就是一个人静静的呆着。

爸爸妈妈就急了,强拖着孝之出门,去看医生。

医生检查过孝之,说:这货没任何毛病,比任何一个人都健康。

不可能!孝之爸妈不信,一个外向运动型孩子,突然间变成这样,一定是遭受了什么,比如说被性侵……虽然孝之是个强壮的男人,但遇到变态的人,这事真说不定。

所以爸妈给孝之换了医生。

这次医生说:孝之比任何一个人都健康,没任何毛病。

没任何毛病,孩子咋这样呢?

因为人是不接受挫折或失败的。医生解释说:人遇到挫折或失败,心理上就会受伤,就需要休养生息,调整一段时间。

噢,原来是这样。

爸妈明白了,回家来再细看孩子,真的没什么问题。孝之就是对出门有所抗拒,其他一切正常。你做好了饭菜,给他送进来,他也会愉快吃掉的。让他帮家里收一下衣服,他也很乐意。

就是给孩子一点时间,让孩子调整心态。

于是爸妈就愉快的,给孝之一点时间。

眨眼时间,20年过去了。

20年后的孝之,仍然坐在他的卧室里,足不出户。

48岁男子活活饿死,成年人的苦你不懂

(03)

孝之在卧室,待到2017年。

待到46岁。

待到爸爸已经死了,妈妈每天照顾他。

孝之20年不出门,也不做任何事儿,妈妈养她,是用自己的养老金。

然后妈妈开始恐慌。

已经46岁了,心态还没有“调整”过来,而妈妈79岁了,如果妈妈去世了,46岁的孝之怎么办?

孝之这种情况,在日本称为8050现象。

8050,是说80年代始,20郎当岁的年轻人在家啃老,眨眼功夫啃30年,啃到自己50多岁,父母80多岁。眼看父母就要啃死,这些废物大叔们该啃谁?

举望天下,除了爹妈,50岁的大叔真的没人可啃。

妈妈急了,她决定,在自己死前,教会46岁的儿子刨土觅食。

48岁男子活活饿死,成年人的苦你不懂

(04)

妈妈上网搜索。

搜到一家类似于“中年大叔自立解决方案”的公司。

也可以视为日本的“杨永信”公司。

这种公司,大多名誉不是太好,因为事情是明摆着的,快50岁的大叔了,一辈子躲在卧室不出门,你跟他讲道理不会有用,他50岁了,懂得的道理比你多得多。所以当批判的武器不管用,就只能上武器的批判,就是个打,就是个揍。躲在卧室的大叔被打得受不了,就只能逃出卧室,冲向社会了。

然而天下父母,都是爱孩子的。孝之妈妈的希望是,你们不要用打的,派几个温柔妹纸,爱护我的儿子,在妹子的温柔爱护中,你们想办法让我儿子自立强大,OK?

机构的回答是:奶奶你快点交钱吧,交钱就一切OK。

然而孝之早把妈妈吃穷了。无奈妈妈卖掉房产,交了918万日元的矫正费用——折合人民币,53.7万。

2017年1月18日,机构来了一群人,要把46岁的孝之带走。

当时孝之是抗拒的,各种哭,各种闹,妈咪妈咪救救我,不要把我带走……但哭闹不管用,孝之还是被机构强行带走了。

孝之被带到了熊本地方。

熊本在日本西端,可以说远离家乡了。

孝之被带走后,各种捷报频传:你儿子矫正初见成效,现在可以跟人聊天了,他可以出门了,他喜欢出门了,他追妹子了,他……6个月后,宅在家中20年的孝之,进入一家保健机构工作,职责是在厨房洗碗。而且矫正机构证实,孝之与同事们相处愉快,大家都喜欢他。

妈妈如释重负。

然后妈妈按机构要求,再打款386万日元——折合人民币22.6万,给孝之做为后期矫正的款项。

眨眼两年过去,2019年,孝之48岁。

这年4月,81岁的妈妈接到一个电话:熊本有间出租房,房中惊现一枚饿死男人,现年48岁,请你来一下。

啊……81岁的老妈妈,一下子就崩溃了。

情况是这样子的,孝之在机构矫正过程中,确实有效果,也确实在家医护中心的厨房洗碗。但没洗多久,他又辞职躲进出租屋,又不出来了。 

48岁男子活活饿死,成年人的苦你不懂

以前孝之躲在家里卧室,妈妈会做好饭送进去。但在出租屋,没人给他做饭。没人做饭,孝之也不出来,他就一个人,静静的饿死在出租屋了。

(05)

48岁的日本男子,为什么活活饿死,也不肯出屋呢?

第一个:人的生命,是靠精神力量支持的。

网上有句话,有些人20岁就死了,但到80岁才埋。

这话的意思是说,人活着,是靠一种精神力量支持的。如果一个人年纪轻轻,却没有这种精神力量,就会如孝之这种表现,他也会吃,也会喝,但没有能力进入社会。你喂他,他活着也只是具没有精神的躯壳。你不喂他,他活活饿死,也没能力伸手去端一下饭碗。

48岁的日本废男孝之,就是这样。

他活着的只是生理,但精神能量早已耗光。

第二个,人的精神能量,来自于欲望。

欲望这东西,声名很坏。

人世间的很多坏事,都是欲望引发的。

然而这个很坏的欲望,却是人类的心灵能量充电器。人类正因为有欲望,所以才有了蓬勃的干劲。如果没有欲望,大家每天奔忙什么?有病吗?

所以中年人的苦,恰恰不是欲望太多带来的,而是没有欲望,想要自生自灭,而社会和家人却要求你自立,这两种力量的夹磨,导致了中年人的内心,苦涩难言。

第三个,低欲望人士,如何自救?

如果说人生只有一门学问,那就是需要学会给自己的欲望充电,让自己时刻保持干劲。

给欲望充电也很简单,就是多读历史上那些思想家传记、帝王史及富豪史,思想是人类最强势的欲望,而权力和财富,更是刺激普通人的不二法门。如孝之,他之所以沦为低欲望人士,这跟他的家庭欲望不高,有很大关系。如果他的父母在早年不是吃养老金躺平,就会引导着孝之频繁参加社会互动。但因为这个家庭是自闭的,所以才会出现孝之这种无解之症。

作者:老雾    
来源:雾满拦江(ID:lwwuwuwu)

转自:https://mp.weixin.qq.com/s/saYSQjrncp6MK7fE1NeMTg

中国房地产,正在做难而正确的事情!

1

人人都说,今年很难,房地产很难。
然而,和往年不同的是。
今年的“难”,和往年有着根本的不同。
2008年很难,因为美国金融危机造成全球经济动荡。
2014年很难,因为高库存压得所有人透不过气来。
2020年很难,因为疫情让所有行业失去了秩序。
然而,2021年呢?
开年很顺,小阳春灿烂,对于下半年,除了东北几个城市,全国从南到北斗弥漫着一种乐观情绪。
众多媒体还在预测——美国大放水,资产大涨价,国外楼市大涨价,一线城市大涨价,全国楼市会不会重复2016年的故事。
然而,2016年盛夏没有来,来的却是2008年的风暴。
不同的是,08年的风暴起于太平洋的那一端。
今年的风暴却起于北京。

2
作者的家乡郑州挨着黄河,黄河每年在主汛期七八月来临之前,都要搞一次为期一个月的人工洪峰。这种人工洪峰有一个专业词语——黄河调水调沙。
黄河之上最大的水电站——洛阳小浪底,在大约每年6月中下旬,都会开启一个比以往下泄流量大几倍的水量,形成一个中小等级的人工洪峰。
虽说是人工洪峰,但是依旧会给下游造成一些麻烦。
比如说淹没临河耕地,造成一些河道设施破坏,形成一些下游经济损失,甚至需要沿河一些家庭临时搬家。
国家为什么要自造洪水?给自身造成一些麻烦,给下游造成一些损失?
因为,只有这样才能形成黄河的长治久安,年年安澜。
原因一:为了腾空小浪底的部分库容,这样更加容易迎接即将到来的黄河每年夏汛秋讯洪水。
原因二:为了让下游检验防洪设施,看看哪里出现了问题,你可以看成这是黄河每年一度的提前防洪演习。
原因三,也是最主要的一条——束水冲沙。
平常黄河水流的速度较慢,带走的泥沙太有限,大量的泥沙沉积河底,所以黄河下游河床越堆越高,最后形成了千古地上悬河。
所以,黄河一旦决堤,就是一盆洗澡水从天而降,能把从洛阳到郑州,济南,再到东营所有沿黄城市来个灭顶之灾。
筑高堤坝只是解决临时问题,解决河床越来越高的悬河问题才是根本。

图片

只有把水量加大,水流的速度加大,才能带走更多的泥沙。
让泥沙大量入海,才能能保证小浪底库容永远不被填平,才能保证下游河床、河道越来越低,才能保证黄河长治久安。

3
中国的房地产,实际上有两条地上悬河。
一条是明河,就是相对于较低的居民收入,高高的房价已经形成了地上悬河。
一条是暗河,房地产企业的数量多,高杠杆,胆子大,已经形成另一条更高的地上悬河。
中国的开发商有多少?
——约100000家,十万家。

图片

根据国家工商局的统计,2018年我国房地产开发商一共97000家,到了2021年绝对十万家不止,也就是说在中国平均14000多人,4000个家庭,就有一家房地产公司。
这个比例高吗?非常之高。
同样是2018年,在美国50个州的工商登记记录中,注册的开发公司数量不超过500家。
美国人口3个亿,平均60万人一家公司。
实际上,世界上全部住宅开发商加起来,很可能还不如中国开发商总量的三分之一。
公司小而多,就意味着泥沙俱下。
公司小而多,就意味着质量层次不齐,难以形成规模效应,开发优势。
公司小而多,就意味着管理困难,爆雷风险巨大。

4
房地产公司多,还不是主要问题。
最大的问题就是,这些公司一个比一个胆子大,杠杆高,路子野。
先说一个宏观数据。
香港开发商,平均资产负债率是40%到50%,这在西方世界的企业中已经算是不低的了。
中国开发商是多少?
中国房地产开发商平均负债率为80%。
注意,不是一家,两家,是全行业,是全部十万家企业的平均资产负债率。
这个负债率,是中国所有工商登记非银行类行业中最多的。
那么,大企业,行业龙头是不是好一些呢?
对不起,更高,所有规模以上开发商平均资产负债率达到87%,比平均水平还高。
甚至,部分企业,已经达到了惊人的程度。

图片

华夏幸福:208%蓝光发展:227%。泰禾集团居然高达——438%,借的债已经能买自己四个了。
至于恒大,虽然99.8%的资产负债率,差一丢丢资不抵债,还不算规模企业最差的水平。
然而,这大哥玩的更花,恒大财富,恒大造车,恒大保险,都是表外融资,好处是渠道多,来钱快,东边不亮西边亮。
但是坏处是,一荣俱荣,一损俱损,一爆俱爆,一完俱完。
所以,恒大财富爆了,恒大房产也就爆了,恒大系也就爆了。

5
房地产行业,企业小又多,管理困难。
房地产企业,尤其是大企业,杠杆高,负债高,路子野,胆子大。
所以,这都是问题,这都是危机,这都是火药桶。
中国房地产高速发展三十年没有出现大问题,没有出现致命危险,是因为房价涨的太快房地产利润过高。
这个行业的一切问题,被房价的快速增长所掩盖。
这些企业的一切问题,被开发项目过高的利润所掩盖。
这就像,你买的房子交房的时候漏水,正常情况下你需要找开发商维修。
如果,你的房子房价大涨,甚至开发商不给你维修,你自己维修你都不会有太多怨言。
相反,你的房子房价大跌,你是不是马上想到,你要用这个借口去退房。这就是导火索。
当一个行业充满了风险点,充满了矛盾,任何一个导火索,都会引发连环危机。
比如,去年疫情诱发了长租公寓行业的危机,让这个行业几乎全部暴雷。
究其原因,是因为这个行业长时间的畸形、快速、高杠杆,甚至是庞氏骗局式的发展,而疫情造成公寓空置,只是一个诱因。
换句话来说,即使没有疫情,这个行业也必将在某一个诱因发作下,轰然倒下。

6
国家可以接受长租公寓行业轰然倒下。
其代价,无非是数百个长租公寓公司跑路。无非是几万房客,钱房两空。无非是几个亿到几十个亿的卷钱跑路。国家有足够实力进行托底。
然而,房地产呢?
你能接受房地产全行业的被引爆吗?
你能接受你的房子房价下跌三分之一到一半吗?
银行和金融系统能接受作为主要质押品的房子价值大规模贬值吗?
所以,要趁着还能掌控的情况下,进行“悬河治理”,进行“束水冲沙”,把这些劣质开发商,趁机清理掉,把这些行业大雷定向引爆掉。
《人民日报》权威人士所说——化解金融行业系统性风险,严守不发生系统性风险底线。
绝不是一句话空话,更不是仅仅是金融行业的事情。
要知道,当年国家引爆p2p,就是这个套路。
趁着还能掌控,做定向爆破,做精准爆破,做可以承受和托底的排雷。
不要说,行业永远发展,明天永远比今天美好,国家一定和平稳定。
当,一条河流已经变成悬河,变成一颗不定时的炸弹,任何一个不经意小的疏漏,都能引发滔天的洪水。
黄河如此,行业如此,国家亦是如此。