3万莆田人占领深圳黄金街

他们做生意远比想象中厉害。

作者 | 石恩泽

来源 | 读城记工作室

(ID:DUCHENGJIPLUS)

深圳水贝是个什么地方?

在深圳还是深圳圩时,这里就是深圳圩最大的村落。现在,水贝出产了全国70%以上的珠宝,年产值超4000亿元,被誉为“珠宝第一村“。

水贝的中心,立着3层共10000多平方米的水贝国际珠宝交易中心。施华洛世奇、ENZO、周生生、周大福等众多品牌陈列其中。

交易中心外墙挂着的巨幅海报上,一众佩戴着项链和耳环的女明星,正巧笑倩兮地望着路过的人。

3万莆田人占领深圳黄金街

△水贝国际珠宝交易中心部分外墙上的宣传图   

时代周报记者  石恩泽/摄

把这些女明星们请来造梦的,是水贝珠宝江湖里的六大门派:福建莆田黄金派、潮汕揭阳玉石派、浙江诸暨珍珠派、江苏东海水晶派、山东昌乐蓝宝石派,和河南南阳和田玉派。

而在六大派中,莆田黄金派最为兴盛。

据深圳莆田商会统计,在中国每年近6000亿元的珠宝零售“盘子”里,莆田人占据了三分之一的份额。单单在水贝,就有约3万莆商,经营着1500多家珠宝店。

舍得砸钱

“全国珠宝风往哪里刮,就看深圳水贝卖什么货。”有业内人士向时代周报记者表示,深圳罗湖水贝的黄金珠宝,可以说是全国的风向标。

在水贝从事了8年黄金生意的阿宝对时代周报记者表示:“水贝是全国珠宝工厂工艺级别最高的地方。例如5D硬金(比一般金饰更轻、亮、纯、韧、硬)最早就是从水贝开始推广的。”

3万莆田人占领深圳黄金街

△在林国春的黄金展厅选购的顾客   时代周报记者  石恩泽/摄

从水贝将黄金工艺推广到全国的,大多是莆田黄金派。

早年间,水贝因毗邻香港的地理位置,吸引了大批珠宝手艺人。而莆田的黄金商人也是在这时候来到深圳。据深圳市莆田商会记录,1992年,深圳迎来第一批做黄金生意的莆商。

深圳市莆田商会会长林国春向时代周报记者表示,深圳作为特区,当时经商氛围浓厚,优秀的手艺人都被吸引而来。

如今,在深圳水贝的黄金珠宝街上,林国春拥有一家占地5000平方米的黄金批发展厅。展厅内的采购商大多是来自三、四线城市的批发商。一位采购人员介绍称,这里每笔交易的拿货量都在500克左右,价格通常在20万元以上。

莆田黄金派曾经也有竞争对手。据林国春回忆,他刚来深圳时,莆田和潮汕的势力基本是五五分,大家在各自领域相互发展,做到了既竞争又合作。

但随后,潮汕人逐渐败退。一位黄金业内资深人士告诉时代周报记者,对比潮汕人,莆田人在营销上更舍得花钱。“莆田人愿意砸钱租最贵的铺位、最显眼的广告位、最响亮的冠名权,但这些潮汕人舍不得。”

抱团的莆田人

时代周报记者翻阅深圳市莆田商会的宣传册时发现,商会管理者中,有近四成的管理者姓林。

管理人员之一的林庆嘉解释道:“我们抱团都是从自己身边人入手,先是把自己家族内的兄弟姐妹、亲戚朋友带上,在逐步把村里人都叫出来帮忙,把盘子越铺越大。“

林庆嘉自己,早年在福建从事银行业工作,后来架不住亲戚林国春的“挖角”,辞职来深圳加入了黄金生意。

此前,时代周报记者走访福建莆田北高镇时,当地金商赵小卓介绍称,旁人听来宛如天书的莆田话,恰是黄金行业内的财富暗号。在黄金珠宝的圈子里,上游下游,认的皆是这一口乡音。

他表示,做黄金生意,资金最重要,但莆田人一般不会向银行贷款,透过亲戚或老乡合伙,他们在一天内融到巨款不是难事。而相熟的黄金商人打交道时,若开口讲起的是莆田话,有时候甚至可以少付上百万的定金。

3万莆田人占领深圳黄金街

△深圳水贝的外墙广告   时代周报记者  石恩泽/摄

“他们做生意远比想象中厉害!”水贝当地的一位黄金商人感慨道,莆田人一个带一个,迅速就拿下了黄金市场。

赵小卓的大伯几年前仍在从事上游的拖金业务(指从产地长途托运和贩卖黄金原料);几个堂兄弟则包揽了家族的黄金零售生意,在全国范围内开起了金店;家族里打金手艺好的,则在厂里当工匠师傅。

品牌之困

一位到水贝的采购商称:“在中国尤其在深圳做黄金批发,一定绕不开莆田人。”

不仅批发绕不过,零售端也被莆田人包圆了。林国春告诉时代周报记者:“不管是国内哪一个黄金牌子,他们的终端销售,都是靠我们莆田人做起来的。

虽然在全国黄金市场中独占鳌头,但莆田人的黄金生意并不好做。

从事黄金珠宝生意的阿宝称:“现在珠宝行业最赚钱的阶段已经过去了,早年间只要开一间铺子,轻轻松松赚两倍,但现在整个行业的毛利率已经压缩在20%以内。”

也许是受莆田鞋影响,即便占据了市场,但莆田黄金在消费者心目中的形象似乎并不好。有消费者直言:“你告诉我哪家金铺是莆田人开的,我要避雷。”设计上涉嫌抄袭著名品牌,纯金不纯等非议一直伴随着莆田黄金派。

林国春并不避讳这点:“周大福、六福、中国黄金、老凤祥……唉,可惜,没有一家是莆田人自己的。“

他介绍称,这些知名品牌背后,从金矿货源、工厂加工、商铺运营到最后交到消费者手上,都由莆田人一手包办。但莆商每年还要花费60万去买一个响亮品牌的背书。“都是因为我们自己的牌子不够响亮啊!”

阿宝已经意识到了这个问题。今年春节后,她悄然离开了水贝,创立了个人品牌的珠宝店。

电商们也在悄然逼近。在抖音带货排行榜上,今年9月份,主播“董先生珠宝”直播销售额高达6.67亿,个人战绩环比增长81.7%,成功超过“真还传”主播罗永浩。

名为“董先生珠宝·直播基地”的大型展厅正是设在水贝,与林国春的黄金批发展厅遥遥相望。

3万莆田人占领深圳黄金街

△位于深圳水贝的电商直播基地   时代周报记者  石恩泽/摄

在水贝,所有黄金珠宝业内的人在采访中都不约而同地提到,未来整个行业必定将往个性化、定制化方向发展,转型对于珠宝商来说迫在眉睫。

但林国春同样也清楚的认识到,讲品牌、讲情怀,不是光喊口号、做广告、砸钱就能成。“一个百年品牌是需要几代人拧成一股绳,将品牌的核心价值观沉淀下来,才能做到让消费者认可。”林国春说。

林国春甚至觉得,他这一代人已经很难完成莆田人在品牌上的转型,但他说,“没关系的!我们莆商在吃苦耐劳和抱团上,是专业的。”

(时代周报记者郭梓昊对本文亦有贡献)

转自:https://mp.weixin.qq.com/s/AhnRgUJE1xGF3dzwwBuw5Q

Nginx一网打尽:动静分离、压缩、缓存、黑白名单、跨域、高可用、性能优化…

  • 引言
  • 一、性能怪兽-Nginx概念深入浅出
  • 二、Nginx环境搭建
  • 三、Nginx反向代理-负载均衡
  • 四、Nginx动静分离
  • 五、Nginx资源压缩
  • 六、Nginx缓冲区
  • 七、Nginx缓存机制
  • 八、Nginx实现IP黑白名单
  • 九、Nginx跨域配置
  • 十、Nginx防盗链设计
  • 十一、Nginx大文件传输配置
  • 十二、Nginx配置SLL证书
  • 十三、Nginx的高可用
  • 十四、Nginx性能优化
  • 十五、放在最后的结尾

 

Nginx一网打尽:动静分离、压缩、缓存、黑白名单、跨域、高可用、性能优化...

# 引言

Nginx一网打尽:动静分离、压缩、缓存、黑白名单、跨域、高可用、性能优化...

早期的业务都是基于单体节点部署,由于前期访问流量不大,因此单体结构也可满足需求,但随着业务增长,流量也越来越大,那么最终单台服务器受到的访问压力也会逐步增高。时间一长,单台服务器性能无法跟上业务增长,就会造成线上频繁宕机的现象发生,最终导致系统瘫痪无法继续处理用户的请求。

从上面的描述中,主要存在两个问题:
①单体结构的部署方式无法承载日益增长的业务流量。
②当后端节点宕机后,整个系统会陷入瘫痪,导致整个项目不可用。

 

因此在这种背景下,引入负载均衡技术可带来的收益:

 

  • 系统的高可用:当某个节点宕机后可以迅速将流量转移至其他节点。

  • 系统的高性能:多台服务器共同对外提供服务,为整个系统提供了更高规模的吞吐。

  • 系统的拓展性:当业务再次出现增长或萎靡时,可再加入/减少节点,灵活伸缩。

OK~,既然引入负载均衡技术可给我们带来如此巨大的好处,那么又有那些方案可供选择呢?主要有两种负载方案,硬件层面与软件层面,比较常用的硬件负载器有A10、F5等,但这些机器动辄大几万乃至几十万的成本,因此一般大型企业会采用该方案,如银行、国企、央企等。

而成本有限,但依旧想做负载均衡的项目,那么可在软件层面实现,如典型的Nginx等,软件层的负载也是本文的重点,毕竟Boss们的准则之一就是:能靠技术实现的就尽量不花钱。

 

Nginx一网打尽:动静分离、压缩、缓存、黑白名单、跨域、高可用、性能优化...

# 性能怪兽-Nginx概念深入浅出

Nginx一网打尽:动静分离、压缩、缓存、黑白名单、跨域、高可用、性能优化...

Nginx是目前负载均衡技术中的主流方案,几乎绝大部分项目都会使用它,Nginx是一个轻量级的高性能HTTP反向代理服务器,同时它也是一个通用类型的代理服务器,支持绝大部分协议,如TCP、UDP、SMTP、HTTPS等。


Nginx一网打尽:动静分离、压缩、缓存、黑白名单、跨域、高可用、性能优化...

Nginx与之前谈及的《Redis》相同,都是基于多路复用模型构建出的产物,因此它与Redis同样具备资源占用少、并发支持高的特点,在理论上单节点的Nginx同时支持5W并发连接,而实际生产环境中,硬件基础到位再结合简单调优后确实能达到该数值。

 

先来看看Nginx引入前后,客户端请求处理流程的对比:


Nginx一网打尽:动静分离、压缩、缓存、黑白名单、跨域、高可用、性能优化...

 

原本客户端是直接请求目标服务器,由目标服务器直接完成请求处理工作,但加入Nginx后,所有的请求会先经过Nginx,再由其进行分发到具体的服务器处理,处理完成后再返回Nginx,最后由Nginx将最终的响应结果返回给客户端。

 

了解了Nginx的基本概念后,再来快速搭建一下环境,以及了解一些Nginx的高级特性,如动静分离、资源压缩、缓存配置、IP黑名单、高可用保障等。

 

 

Nginx一网打尽:动静分离、压缩、缓存、黑白名单、跨域、高可用、性能优化...

# Nginx环境搭建

Nginx一网打尽:动静分离、压缩、缓存、黑白名单、跨域、高可用、性能优化...

❶首先创建Nginx的目录并进入:

[root@localhost]# mkdir /soft && mkdir /soft/nginx/[root@localhost]# cd /soft/nginx/

❷下载Nginx的安装包,可以通过FTP工具上传离线环境包,也可通过wget命令在线获取安装包:

[root@localhost]# wget https://nginx.org/download/nginx-1.21.6.tar.gz

没有wget命令的可通过yum命令安装:

[root@localhost]# yum -y install wget

❸解压Nginx的压缩包:

[root@localhost]# tar -xvzf nginx-1.21.6.tar.gz

❹下载并安装Nginx所需的依赖库和包:

[root@localhost]# yum install --downloadonly --downloaddir=/soft/nginx/ gcc-c++[root@localhost]# yum install --downloadonly --downloaddir=/soft/nginx/ pcre pcre-devel4[root@localhost]# yum install --downloadonly --downloaddir=/soft/nginx/ zlib zlib-devel[root@localhost]# yum install --downloadonly --downloaddir=/soft/nginx/ openssl openssl-devel

也可以通过yum命令一键下载(推荐上面哪种方式):

[root@localhost]# yum -y install gcc zlib zlib-devel pcre-devel openssl openssl-devel

执行完成后,然后ls查看目录文件,会看一大堆依赖:


Nginx一网打尽:动静分离、压缩、缓存、黑白名单、跨域、高可用、性能优化...

紧接着通过rpm命令依次将依赖包一个个构建,或者通过如下指令一键安装所有依赖包:

[root@localhost]# rpm -ivh --nodeps *.rpm

❺进入解压后的nginx目录,然后执行Nginx的配置脚本,为后续的安装提前配置好环境,默认位于/usr/local/nginx/目录下(可自定义目录):

[root@localhost]# cd nginx-1.21.6[root@localhost]# ./configure --prefix=/soft/nginx/

❻编译并安装Nginx:

[root@localhost]# make && make install

❼最后回到前面的/soft/nginx/目录,输入ls即可看见安装nginx完成后生成的文件。

❽修改安装后生成的conf目录下的nginx.conf配置文件:

[root@localhost]# vi conf/nginx.conf    修改端口号:listen    80;  修改IP地址:server_name  你当前机器的本地IP(线上配置域名);

❾制定配置文件并启动Nginx:

[root@localhost]# sbin/nginx -c conf/nginx.conf[root@localhost]# ps aux | grep nginx

Nginx其他操作命令:

sbin/nginx -t -c conf/nginx.conf # 检测配置文件是否正常sbin/nginx -s reload -c conf/nginx.conf # 修改配置后平滑重启sbin/nginx -s quit # 优雅关闭Nginx,会在执行完当前的任务后再退出sbin/nginx -s stop # 强制终止Nginx,不管当前是否有任务在执行

❿开放80端口,并更新防火墙:

[root@localhost]# firewall-cmd --zone=public --add-port=80/tcp --permanent[root@localhost]# firewall-cmd --reload[root@localhost]# firewall-cmd --zone=public --list-ports

⓫在Windows/Mac的浏览器中,直接输入刚刚配置的IP地址访问Nginx:


Nginx一网打尽:动静分离、压缩、缓存、黑白名单、跨域、高可用、性能优化...
最终看到如上的Nginx欢迎界面,代表Nginx安装完成。

 

 

Nginx一网打尽:动静分离、压缩、缓存、黑白名单、跨域、高可用、性能优化...

# Nginx反向代理-负载均衡

Nginx一网打尽:动静分离、压缩、缓存、黑白名单、跨域、高可用、性能优化...

首先通过SpringBoot+Freemarker快速搭建一个WEB项目:springboot-web-nginx,然后在该项目中,创建一个IndexNginxController.java文件,逻辑如下:

@Controllerpublic class IndexNginxController {    @Value("${server.port}")    private String port;
    @RequestMapping("/")    public ModelAndView index(){        ModelAndView model = new ModelAndView();        model.addObject("port", port);        model.setViewName("index");        return model;    }}

在该Controller类中,存在一个成员变量:port,它的值即是从application.properties配置文件中获取server.port值。当出现访问/资源的请求时,跳转前端index页面,并将该值携带返回。

 

前端的index.ftl文件代码如下:

<html>    <head>        <title>Nginx演示页面</title>        <link href="nginx_style.css" rel="stylesheet" type="text/css"/>    </head>    <body>        <div style="border: 2px solid red;margin: auto;width: 800px;text-align: center">            <div  id="nginx_title">                <h1>欢迎来到熊猫高级会所,我是竹子${port}号!</h1>            </div>        </div>    </body></html>

从上可以看出其逻辑并不复杂,仅是从响应中获取了port输出。

 

OK~,前提工作准备就绪后,再简单修改一下nginx.conf的配置即可:

upstream nginx_boot{   # 30s内检查心跳发送两次包,未回复就代表该机器宕机,请求分发权重比为1:2   server 192.168.0.000:8080 weight=100 max_fails=2 fail_timeout=30s;    server 192.168.0.000:8090 weight=200 max_fails=2 fail_timeout=30s;   # 这里的IP请配置成你WEB服务所在的机器IP}
server {    location / {        root   html;        # 配置一下index的地址,最后加上index.ftl。        index  index.html index.htm index.jsp index.ftl;        proxy_set_header Host $host;        proxy_set_header X-Real-IP $remote_addr;        proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;        # 请求交给名为nginx_boot的upstream上        proxy_pass http://nginx_boot;    }}

至此,所有的前提工作准备就绪,紧接着再启动Nginx,然后再启动两个web服务,第一个WEB服务启动时,在application.properties配置文件中,将端口号改为8080,第二个WEB服务启动时,将其端口号改为8090。

最终来看看效果:


Nginx一网打尽:动静分离、压缩、缓存、黑白名单、跨域、高可用、性能优化...

因为配置了请求分发的权重,8080、8090的权重比为2:1,因此请求会根据权重比均摊到每台机器,也就是8080一次、8090两次、8080一次……

 

 

Nginx一网打尽:动静分离、压缩、缓存、黑白名单、跨域、高可用、性能优化...

Nginx请求分发原理

Nginx一网打尽:动静分离、压缩、缓存、黑白名单、跨域、高可用、性能优化...

 

客户端发出的请求192.168.12.129最终会转变为:http://192.168.12.129:80/,然后再向目标IP发起请求,流程如下:


Nginx一网打尽:动静分离、压缩、缓存、黑白名单、跨域、高可用、性能优化...

  • 由于Nginx监听了192.168.12.129的80端口,所以最终该请求会找到Nginx进程;

  • Nginx首先会根据配置的location规则进行匹配,根据客户端的请求路径/,会定位到location /{}规则;

  • 然后根据该location中配置的proxy_pass会再找到名为nginx_boot的upstream;

  • 最后根据upstream中的配置信息,将请求转发到运行WEB服务的机器处理,由于配置了多个WEB服务,且配置了权重值,因此Nginx会依次根据权重比分发请求。

 

 

Nginx一网打尽:动静分离、压缩、缓存、黑白名单、跨域、高可用、性能优化...

# Nginx动静分离

Nginx一网打尽:动静分离、压缩、缓存、黑白名单、跨域、高可用、性能优化...

动静分离应该是听的次数较多的性能优化方案,那先思考一个问题:为什么需要做动静分离呢?它带来的好处是什么?其实这个问题也并不难回答,当你搞懂了网站的本质后,自然就理解了动静分离的重要性。先来以淘宝为例分析看看:


Nginx一网打尽:动静分离、压缩、缓存、黑白名单、跨域、高可用、性能优化...

当浏览器输入www.taobao.com访问淘宝首页时,打开开发者调试工具可以很明显的看到,首页加载会出现100+的请求数,而正常项目开发时,静态资源一般会放入到resources/static/目录下:


Nginx一网打尽:动静分离、压缩、缓存、黑白名单、跨域、高可用、性能优化...

在项目上线部署时,这些静态资源会一起打成包,那此时思考一个问题:假设淘宝也是这样干的,那么首页加载时的请求最终会去到哪儿被处理?答案毋庸置疑,首页100+的所有请求都会来到部署WEB服务的机器处理,那则代表着一个客户端请求淘宝首页,就会对后端服务器造成100+的并发请求。毫无疑问,这对于后端服务器的压力是尤为巨大的。

但此时不妨分析看看,首页100+的请求中,是不是至少有60+是属于*.js、*.css、*.html、*.jpg…..这类静态资源的请求呢?答案是Yes。

既然有这么多请求属于静态的,这些资源大概率情况下,长时间也不会出现变动,那为何还要让这些请求到后端再处理呢?能不能在此之前就提前处理掉?当然OK,因此经过分析之后能够明确一点:做了动静分离之后,至少能够让后端服务减少一半以上的并发量。到此时大家应该明白了动静分离能够带来的性能收益究竟有多大。

 

OK~,搞清楚动静分离的必要性之后,如何实现动静分离呢?其实非常简单,实战看看。

 

①先在部署Nginx的机器,Nginx目录下创建一个目录static_resources:

mkdir static_resources

②将项目中所有的静态资源全部拷贝到该目录下,而后将项目中的静态资源移除重新打包。

 

③稍微修改一下nginx.conf的配置,增加一条location匹配规则:

location ~ .*.(html|htm|gif|jpg|jpeg|bmp|png|ico|txt|js|css){    root   /soft/nginx/static_resources;    expires 7d;}

然后照常启动nginx和移除了静态资源的WEB服务,你会发现原本的样式、js效果、图片等依旧有效,如下:


Nginx一网打尽:动静分离、压缩、缓存、黑白名单、跨域、高可用、性能优化...

其中static目录下的nginx_style.css文件已被移除,但效果依旧存在(绿色字体+蓝色大边框):


Nginx一网打尽:动静分离、压缩、缓存、黑白名单、跨域、高可用、性能优化...

最后解读一下那条location规则:
location ~ .*.(html|htm|gif|jpg|jpeg|bmp|png|ico|txt|js|css)
~代表匹配时区分大小写
.*代表任意字符都可以出现零次或多次,即资源名不限制
.代表匹配后缀分隔符.
(html|…|css)代表匹配括号里所有静态资源类型
综上所述,简单一句话概述:该配置表示匹配以.html~.css为后缀的所有资源请求。

最后提一嘴,也可以将静态资源上传到文件服务器中,然后location中配置一个新的upstream指向。

 

 

Nginx一网打尽:动静分离、压缩、缓存、黑白名单、跨域、高可用、性能优化...

# Nginx资源压缩

Nginx一网打尽:动静分离、压缩、缓存、黑白名单、跨域、高可用、性能优化...

建立在动静分离的基础之上,如果一个静态资源的Size越小,那么自然传输速度会更快,同时也会更节省带宽,因此我们在部署项目时,也可以通过Nginx对于静态资源实现压缩传输,一方面可以节省带宽资源,第二方面也可以加快响应速度并提升系统整体吞吐。

 

在Nginx也提供了三个支持资源压缩的模块ngx_http_gzip_module、ngx_http_gzip_static_module、ngx_http_gunzip_module,其中ngx_http_gzip_module属于内置模块,代表着可以直接使用该模块下的一些压缩指令,后续的资源压缩操作都基于该模块,先来看看压缩配置的一些参数/指令:

 

参数项 释义 参数值
gzip 开启或关闭压缩机制 on/off;
gzip_types 根据文件类型选择性开启压缩机制 image/png、text/css…
gzip_comp_level 用于设置压缩级别,级别越高越耗时 1~9(越高压缩效果越好)
gzip_vary 设置是否携带Vary:Accept-Encoding头域的响应头部 on/off;
gzip_buffers 设置处理压缩请求的缓冲区数量和大小 数量 大小,如16 8k;
gzip_disable 针对不同客户端的请求来设置是否开启压缩 如 .*Chrome.*;
gzip_http_version 指定压缩响应所需要的最低HTTP请求版本 如1.1;
gzip_min_length 设置触发压缩的文件最低大小 如512k;
gzip_proxied 对于后端服务器的响应结果是否开启压缩 off、expired、no-cache…

了解了Nginx中的基本压缩配置后,接下来可以在Nginx中简单配置一下:

http{    # 开启压缩机制    gzip on;    # 指定会被压缩的文件类型(也可自己配置其他类型)    gzip_types text/plain application/javascript text/css application/xml text/javascript image/jpeg image/gif image/png;    # 设置压缩级别,越高资源消耗越大,但压缩效果越好    gzip_comp_level 5;    # 在头部中添加Vary: Accept-Encoding(建议开启)    gzip_vary on;    # 处理压缩请求的缓冲区数量和大小    gzip_buffers 16 8k;    # 对于不支持压缩功能的客户端请求不开启压缩机制    gzip_disable "MSIE [1-6]."; # 低版本的IE浏览器不支持压缩    # 设置压缩响应所支持的HTTP最低版本    gzip_http_version 1.1;    # 设置触发压缩的最小阈值    gzip_min_length 2k;    # 关闭对后端服务器的响应结果进行压缩    gzip_proxied off;}

在上述的压缩配置中,最后一个gzip_proxied选项,可以根据系统的实际情况决定,总共存在多种选项:

 

  • off:关闭Nginx对后台服务器的响应结果进行压缩。

  • expired:如果响应头中包含Expires信息,则开启压缩。

  • no-cache:如果响应头中包含Cache-Control:no-cache信息,则开启压缩。

  • no-store:如果响应头中包含Cache-Control:no-store信息,则开启压缩。

  • private:如果响应头中包含Cache-Control:private信息,则开启压缩。

  • no_last_modified:如果响应头中不包含Last-Modified信息,则开启压缩。

  • no_etag:如果响应头中不包含ETag信息,则开启压缩。

  • auth:如果响应头中包含Authorization信息,则开启压缩。

  • any:无条件对后端的响应结果开启压缩机制。

 

OK~,简单修改好了Nginx的压缩配置后,可以在原本的index页面中引入一个jquery-3.6.0.js文件:

<script type="text/javascript" src="jquery-3.6.0.js"></script>

分别来对比下压缩前后的区别:
Nginx一网打尽:动静分离、压缩、缓存、黑白名单、跨域、高可用、性能优化...
从图中可以很明显看出,未开启压缩机制前访问时,js文件的原始大小为230K,当配置好压缩后再重启Nginx,会发现文件大小从230KB→69KB,效果立竿见影!

注意点:
①对于图片、视频类型的数据,会默认开启压缩机制,因此一般无需再次开启压缩。
②对于.js文件而言,需要指定压缩类型为application/javascript,而并非text/javascript、application/x-javascript。

 

 

Nginx一网打尽:动静分离、压缩、缓存、黑白名单、跨域、高可用、性能优化...

# Nginx缓冲区

Nginx一网打尽:动静分离、压缩、缓存、黑白名单、跨域、高可用、性能优化...

先来思考一个问题,接入Nginx的项目一般请求流程为:“客户端→Nginx→服务端”,在这个过程中存在两个连接:“客户端→Nginx、Nginx→服务端”,那么两个不同的连接速度不一致,就会影响用户的体验(比如浏览器的加载速度跟不上服务端的响应速度)。


其实也就类似电脑的内存跟不上CPU速度,所以对于用户造成的体验感极差,因此在CPU设计时都会加入三级高速缓冲区,用于缓解CPU和内存速率不一致的矛盾。在Nginx也同样存在缓冲区的机制,主要目的就在于:用来解决两个连接之间速度不匹配造成的问题,有了缓冲后,Nginx代理可暂存后端的响应,然后按需供给数据给客户端。先来看看一些关于缓冲区的配置项:

 

  • proxy_buffering:是否启用缓冲机制,默认为on关闭状态。

  • client_body_buffer_size:设置缓冲客户端请求数据的内存大小。

  • proxy_buffers:为每个请求/连接设置缓冲区的数量和大小,默认4 4k/8k。

  • proxy_buffer_size:设置用于存储响应头的缓冲区大小。

  • proxy_busy_buffers_size:在后端数据没有完全接收完成时,Nginx可以将busy状态的缓冲返回给客户端,该参数用来设置busy状态的buffer具体有多大,默认为proxy_buffer_size*2。

  • proxy_temp_path:当内存缓冲区存满时,可以将数据临时存放到磁盘,该参数是设置存储缓冲数据的目录。

    • path是临时目录的路径。

    • 语法:proxy_temp_path path;

  • proxy_temp_file_write_size:设置每次写数据到临时文件的大小限制。

  • proxy_max_temp_file_size:设置临时的缓冲目录中允许存储的最大容量。

  • 非缓冲参数项:

    • proxy_connect_timeout:设置与后端服务器建立连接时的超时时间。

    • proxy_read_timeout:设置从后端服务器读取响应数据的超时时间。

    • proxy_send_timeout:设置向后端服务器传输请求数据的超时时间。

 

具体的nginx.conf配置如下:

http{    proxy_connect_timeout 10;    proxy_read_timeout 120;    proxy_send_timeout 10;    proxy_buffering on;    client_body_buffer_size 512k;    proxy_buffers 4 64k;    proxy_buffer_size 16k;    proxy_busy_buffers_size 128k;    proxy_temp_file_write_size 128k;    proxy_temp_path /soft/nginx/temp_buffer;}

上述的缓冲区参数,是基于每个请求分配的空间,而并不是所有请求的共享空间。当然,具体的参数值还需要根据业务去决定,要综合考虑机器的内存以及每个请求的平均数据大小。

最后提一嘴:使用缓冲也可以减少即时传输带来的带宽消耗。

 

 

Nginx一网打尽:动静分离、压缩、缓存、黑白名单、跨域、高可用、性能优化...

# Nginx缓存机制

Nginx一网打尽:动静分离、压缩、缓存、黑白名单、跨域、高可用、性能优化...

对于性能优化而言,缓存是一种能够大幅度提升性能的方案,因此几乎可以在各处都能看见缓存,如客户端缓存、代理缓存、服务器缓存等等,Nginx的缓存则属于代理缓存的一种。对于整个系统而言,加入缓存带来的优势额外明显:

 

  • 减少了再次向后端或文件服务器请求资源的带宽消耗。

  • 降低了下游服务器的访问压力,提升系统整体吞吐。

  • 缩短了响应时间,提升了加载速度,打开页面的速度更快。

 

那么在Nginx中,又该如何配置代理缓存呢?先来看看缓存相关的配置项:

 

  • proxy_cache_path:代理缓存的路径。

    • path:缓存的路径地址。

    • levels:缓存存储的层次结构,最多允许三层目录。

    • use_temp_path:是否使用临时目录。

    • keys_zone:指定一个共享内存空间来存储热点Key(1M可存储8000个Key)。

    • inactive:设置缓存多长时间未被访问后删除(默认是十分钟)。

    • max_size:允许缓存的最大存储空间,超出后会基于LRU算法移除缓存,Nginx会创建一个Cache manager的进程移除数据,也可以通过purge方式。

    • manager_files:manager进程每次移除缓存文件数量的上限。

    • manager_sleep:manager进程每次移除缓存文件的时间上限。

    • manager_threshold:manager进程每次移除缓存后的间隔时间。

    • loader_files:重启Nginx载入缓存时,每次加载的个数,默认100。

    • loader_sleep:每次载入时,允许的最大时间上限,默认200ms。

    • loader_threshold:一次载入后,停顿的时间间隔,默认50ms。

    • purger:是否开启purge方式移除数据。

    • purger_files:每次移除缓存文件时的数量。

    • purger_sleep:每次移除时,允许消耗的最大时间。

    • purger_threshold:每次移除完成后,停顿的间隔时间。

    • 语法:proxy_cache_path path [levels=levels] [use_temp_path=on|off] keys_zone=name:size [inactive=time] [max_size=size] [manager_files=number] [manager_sleep=time] [manager_threshold=time] [loader_files=number] [loader_sleep=time] [loader_threshold=time] [purger=on|off] [purger_files=number] [purger_sleep=time] [purger_threshold=time];

    • 是的,你没有看错,就是这么长….,解释一下每个参数项的含义:

  • proxy_cache:开启或关闭代理缓存,开启时需要指定一个共享内存区域。

    • zone为内存区域的名称,即上面中keys_zone设置的名称。

    • 语法:proxy_cache zone | off;

  • proxy_cache_key:定义如何生成缓存的键。

    • string为生成Key的规则,如$scheme$proxy_host$request_uri。

    • 语法:proxy_cache_key string;

  • proxy_cache_valid:缓存生效的状态码与过期时间。

    • code为状态码,time为有效时间,可以根据状态码设置不同的缓存时间。

    • 例如:proxy_cache_valid 200 302 30m;

    • 语法:proxy_cache_valid [code …] time;

  • proxy_cache_min_uses:设置资源被请求多少次后被缓存。

    • number为次数,默认为1。

    • 语法:proxy_cache_min_uses number;

  • proxy_cache_use_stale:当后端出现异常时,是否允许Nginx返回缓存作为响应。

    • error为错误类型,可配置timeout|invalid_header|updating|http_500…。

    • 语法:proxy_cache_use_stale error;

  • proxy_cache_lock:对于相同的请求,是否开启锁机制,只允许一个请求发往后端。

    • 语法:proxy_cache_lock on | off;

  • proxy_cache_lock_timeout:配置锁超时机制,超出规定时间后会释放请求。

    • proxy_cache_lock_timeout time;

  • proxy_cache_methods:设置对于那些HTTP方法开启缓存。

    • method为请求方法类型,如GET、HEAD等。

    • 语法:proxy_cache_methods method;

  • proxy_no_cache:定义不存储缓存的条件,符合时不会保存。

    • string为条件,例如$cookie_nocache $arg_nocache $arg_comment;

    • 语法:proxy_no_cache string…;

  • proxy_cache_bypass:定义不读取缓存的条件,符合时不会从缓存中读取。

    • 和上面proxy_no_cache的配置方法类似。

    • 语法:proxy_cache_bypass string…;

  • add_header:往响应头中添加字段信息。

    • 语法:add_header fieldName fieldValue;

  • $upstream_cache_status:记录了缓存是否命中的信息,存在多种情况:

    • MISS:请求未命中缓存。

    • HIT:请求命中缓存。

    • EXPIRED:请求命中缓存但缓存已过期。

    • STALE:请求命中了陈旧缓存。

    • REVALIDDATED:Nginx验证陈旧缓存依然有效。

    • UPDATING:命中的缓存内容陈旧,但正在更新缓存。

    • BYPASS:响应结果是从原始服务器获取的。

    • PS:这个和之前的不同,之前的都是参数项,这个是一个Nginx内置变量。

 

OK~,对于Nginx中的缓存配置项大概了解后,接着来配置一下Nginx代理缓存:

http{    # 设置缓存的目录,并且内存中缓存区名为hot_cache,大小为128m,    # 三天未被访问过的缓存自动清楚,磁盘中缓存的最大容量为2GB。    proxy_cache_path /soft/nginx/cache levels=1:2 keys_zone=hot_cache:128m inactive=3d max_size=2g;        server{        location / {            # 使用名为nginx_cache的缓存空间            proxy_cache hot_cache;            # 对于200、206、304、301、302状态码的数据缓存1天            proxy_cache_valid 200 206 304 301 302 1d;            # 对于其他状态的数据缓存30分钟            proxy_cache_valid any 30m;            # 定义生成缓存键的规则(请求的url+参数作为key)            proxy_cache_key $host$uri$is_args$args;            # 资源至少被重复访问三次后再加入缓存            proxy_cache_min_uses 3;            # 出现重复请求时,只让一个去后端读数据,其他的从缓存中读取            proxy_cache_lock on;            # 上面的锁超时时间为3s,超过3s未获取数据,其他请求直接去后端            proxy_cache_lock_timeout 3s;            # 对于请求参数或cookie中声明了不缓存的数据,不再加入缓存            proxy_no_cache $cookie_nocache $arg_nocache $arg_comment;            # 在响应头中添加一个缓存是否命中的状态(便于调试)            add_header Cache-status $upstream_cache_status;        }    }}

接着来看一下效果,如下:
Nginx一网打尽:动静分离、压缩、缓存、黑白名单、跨域、高可用、性能优化...
第一次访问时,因为还没有请求过资源,所以缓存中没有数据,因此没有命中缓存。第二、三次,依旧没有命中缓存,直至第四次时才显示命中,这是为什么呢?因为在前面的缓存配置中,我们配置了加入缓存的最低条件为:资源至少要被请求三次以上才会加入缓存。这样可以避免很多无效缓存占用空间。

 

 

Nginx一网打尽:动静分离、压缩、缓存、黑白名单、跨域、高可用、性能优化...

缓存清理

Nginx一网打尽:动静分离、压缩、缓存、黑白名单、跨域、高可用、性能优化...

当缓存过多时,如果不及时清理会导致磁盘空间被“吃光”,因此我们需要一套完善的缓存清理机制去删除缓存,在之前的proxy_cache_path参数中有purger相关的选项,开启后可以帮我们自动清理缓存,但遗憾的是:purger系列参数只有商业版的NginxPlus才能使用,因此需要付费才可使用。

 

不过天无绝人之路,我们可以通过强大的第三方模块ngx_cache_purge来替代,先来安装一下该插件:


①首先去到Nginx的安装目录下,创建一个cache_purge目录:

[root@localhost]# mkdir cache_purge && cd cache_purge

②通过wget指令从github上拉取安装包的压缩文件并解压:

[root@localhost]# wget https://github.com/FRiCKLE/ngx_cache_purge/archive/2.3.tar.gz[root@localhost]# tar -xvzf 2.3.tar.gz

③再次去到之前Nginx的解压目录下:

[root@localhost]# cd /soft/nginx/nginx1.21.6

④重新构建一次Nginx,通过–add-module的指令添加刚刚的第三方模块:

[root@localhost]# ./configure --prefix=/soft/nginx/ --add-module=/soft/nginx/cache_purge/ngx_cache_purge-2.3/

⑤重新根据刚刚构建的Nginx,再次编译一下,但切记不要make install:

[root@localhost]# make

⑥删除之前Nginx的启动文件,不放心的也可以移动到其他位置:

[root@localhost]# rm -rf /soft/nginx/sbin/nginx

⑦从生成的objs目录中,重新复制一个Nginx的启动文件到原来的位置:

[root@localhost]# cp objs/nginx /soft/nginx/sbin/nginx

至此,第三方缓存清除模块ngx_cache_purge就安装完成了,接下来稍微修改一下nginx.conf配置,再添加一条location规则:

location ~ /purge(/.*) {  # 配置可以执行清除操作的IP(线上可以配置成内网机器)  # allow 127.0.0.1; # 代表本机  allow all; # 代表允许任意IP清除缓存  proxy_cache_purge $host$1$is_args$args;}

然后再重启Nginx,接下来即可通过http://xxx/purge/xx的方式清除缓存。

 

 

Nginx一网打尽:动静分离、压缩、缓存、黑白名单、跨域、高可用、性能优化...

# Nginx实现IP黑白名单

Nginx一网打尽:动静分离、压缩、缓存、黑白名单、跨域、高可用、性能优化...

有时候往往有些需求,可能某些接口只能开放给对应的合作商,或者购买/接入API的合作伙伴,那么此时就需要实现类似于IP白名单的功能。而有时候有些恶意攻击者或爬虫程序,被识别后需要禁止其再次访问网站,因此也需要实现IP黑名单。那么这些功能无需交由后端实现,可直接在Nginx中处理。

 

Nginx做黑白名单机制,主要是通过allow、deny配置项来实现:

allow xxx.xxx.xxx.xxx; # 允许指定的IP访问,可以用于实现白名单。deny xxx.xxx.xxx.xxx; # 禁止指定的IP访问,可以用于实现黑名单。

要同时屏蔽/开放多个IP访问时,如果所有IP全部写在nginx.conf文件中定然是不显示的,这种方式比较冗余,那么可以新建两个文件BlocksIP.conf、WhiteIP.conf:

# --------黑名单:BlocksIP.conf---------deny 192.177.12.222; # 屏蔽192.177.12.222访问deny 192.177.44.201; # 屏蔽192.177.44.201访问deny 127.0.0.0/8; # 屏蔽127.0.0.1到127.255.255.254网段中的所有IP访问
# --------白名单:WhiteIP.conf---------allow 192.177.12.222; # 允许192.177.12.222访问allow 192.177.44.201; # 允许192.177.44.201访问allow 127.45.0.0/16; # 允许127.45.0.1到127.45.255.254网段中的所有IP访问deny all; # 除开上述IP外,其他IP全部禁止访问

分别将要禁止/开放的IP添加到对应的文件后,可以再将这两个文件在nginx.conf中导入:

http{    # 屏蔽该文件中的所有IP    include /soft/nginx/IP/BlocksIP.conf;  server{    location xxx {        # 某一系列接口只开放给白名单中的IP        include /soft/nginx/IP/blockip.conf;     } }}

对于文件具体在哪儿导入,这个也并非随意的,如果要整站屏蔽/开放就在http中导入,如果只需要一个域名下屏蔽/开放就在sever中导入,如果只需要针对于某一系列接口屏蔽/开放IP,那么就在location中导入。

当然,上述只是最简单的IP黑/白名单实现方式,同时也可以通过ngx_http_geo_module、ngx_http_geo_module第三方库去实现(这种方式可以按地区、国家进行屏蔽,并且提供了IP库)。

 

Nginx一网打尽:动静分离、压缩、缓存、黑白名单、跨域、高可用、性能优化...

# Nginx跨域配置

Nginx一网打尽:动静分离、压缩、缓存、黑白名单、跨域、高可用、性能优化...

 

跨域问题在之前的单体架构开发中,其实是比较少见的问题,除非是需要接入第三方SDK时,才需要处理此问题。但随着现在前后端分离、分布式架构的流行,跨域问题也成为了每个Java开发必须要懂得解决的一个问题。

 

跨域问题产生的原因

 

产生跨域问题的主要原因就在于同源策略,为了保证用户信息安全,防止恶意网站窃取数据,同源策略是必须的,否则cookie可以共享。由于http无状态协议通常会借助cookie来实现有状态的信息记录,例如用户的身份/密码等,因此一旦cookie被共享,那么会导致用户的身份信息被盗取。


同源策略主要是指三点相同,协议+域名+端口 相同的两个请求,则可以被看做是同源的,但如果其中任意一点存在不同,则代表是两个不同源的请求,同源策略会限制了不同源之间的资源交互。

 

Nginx解决跨域问题

 

弄明白了跨域问题的产生原因,接下来看看Nginx中又该如何解决跨域呢?其实比较简单,在nginx.conf中稍微添加一点配置即可:

location / {    # 允许跨域的请求,可以自定义变量$http_origin,*表示所有    add_header 'Access-Control-Allow-Origin' *;    # 允许携带cookie请求    add_header 'Access-Control-Allow-Credentials' 'true';    # 允许跨域请求的方法:GET,POST,OPTIONS,PUT    add_header 'Access-Control-Allow-Methods' 'GET,POST,OPTIONS,PUT';    # 允许请求时携带的头部信息,*表示所有    add_header 'Access-Control-Allow-Headers' *;    # 允许发送按段获取资源的请求    add_header 'Access-Control-Expose-Headers' 'Content-Length,Content-Range';    # 一定要有!!!否则Post请求无法进行跨域!    # 在发送Post跨域请求前,会以Options方式发送预检请求,服务器接受时才会正式请求    if ($request_method = 'OPTIONS') {        add_header 'Access-Control-Max-Age' 1728000;        add_header 'Content-Type' 'text/plain; charset=utf-8';        add_header 'Content-Length' 0;        # 对于Options方式的请求返回204,表示接受跨域请求        return 204;    }}

在nginx.conf文件加上如上配置后,跨域请求即可生效了。

但如果后端是采用分布式架构开发的,有时候RPC调用也需要解决跨域问题,不然也同样会出现无法跨域请求的异常,因此可以在你的后端项目中,通过继承HandlerInterceptorAdapter类、实现WebMvcConfigurer接口、添加@CrossOrgin注解的方式实现接口之间的跨域配置。

 

 

Nginx一网打尽:动静分离、压缩、缓存、黑白名单、跨域、高可用、性能优化...

# Nginx防盗链设计

Nginx一网打尽:动静分离、压缩、缓存、黑白名单、跨域、高可用、性能优化...

首先了解一下何谓盗链:盗链即是指外部网站引入当前网站的资源对外展示,来举个简单的例子理解:

好比壁纸网站X站、Y站,X站是一点点去购买版权、签约作者的方式,从而积累了海量的壁纸素材,但Y站由于资金等各方面的原因,就直接通过<img src=”X站/xxx.jpg” />这种方式照搬了X站的所有壁纸资源,继而提供给用户下载。

那么如果我们自己是这个X站的Boss,心中必然不爽,那么此时又该如何屏蔽这类问题呢?那么接下来要叙说的防盗链 登场了!

 

Nginx的防盗链机制实现,跟上篇文章《HTTP/HTTPS》中分析到的一个头部字段:Referer有关,该字段主要描述了当前请求是从哪儿发出的,那么在Nginx中就可获取该值,然后判断是否为本站的资源引用请求,如果不是则不允许访问。

 

Nginx中存在一个配置项为valid_referers,正好可以满足前面的需求,语法如下:

 

  • valid_referers none | blocked | server_names | string …;

    • none:表示接受没有Referer字段的HTTP请求访问。

    • blocked:表示允许http://或https//以外的请求访问。

    • server_names:资源的白名单,这里可以指定允许访问的域名。

    • string:可自定义字符串,支配通配符、正则表达式写法。

 

简单了解语法后,接下来的实现如下:

# 在动静分离的location中开启防盗链机制location ~ .*.(html|htm|gif|jpg|jpeg|bmp|png|ico|txt|js|css){    # 最后面的值在上线前可配置为允许的域名地址    valid_referers blocked 192.168.12.129;    if ($invalid_referer) {        # 可以配置成返回一张禁止盗取的图片        # rewrite   ^/ http://xx.xx.com/NO.jpg;        # 也可直接返回403        return   403;    }        root   /soft/nginx/static_resources;    expires 7d;}

根据上述中的内容配置后,就已经通过Nginx实现了最基本的防盗链机制,最后只需要额外重启一下就好啦!当然,对于防盗链机制实现这块,也有专门的第三方模块ngx_http_accesskey_module实现了更为完善的设计,感兴趣的小伙伴可以自行去看看。

PS:防盗链机制也无法解决爬虫伪造referers信息的这种方式抓取数据。

 

 

Nginx一网打尽:动静分离、压缩、缓存、黑白名单、跨域、高可用、性能优化...

# Nginx大文件传输配置

Nginx一网打尽:动静分离、压缩、缓存、黑白名单、跨域、高可用、性能优化...

 

在某些业务场景中需要传输一些大文件,但大文件传输时往往都会会出现一些Bug,比如文件超出限制、文件传输过程中请求超时等,那么此时就可以在Nginx稍微做一些配置,先来了解一些关于大文件传输时可能会用的配置项:

 

配置项 释义
client_max_body_size 设置请求体允许的最大体积
client_header_timeout 等待客户端发送一个请求头的超时时间
client_body_timeout 设置读取请求体的超时时间
proxy_read_timeout 设置请求被后端服务器读取时,Nginx等待的最长时间
proxy_send_timeout 设置后端向Nginx返回响应时的超时时间

 

在传输大文件时,client_max_body_size、client_header_timeout、proxy_read_timeout、proxy_send_timeout这四个参数值都可以根据自己项目的实际情况来配置。

上述配置仅是作为代理层需要配置的,因为最终客户端传输文件还是直接与后端进行交互,这里只是把作为网关层的Nginx配置调高一点,调到能够“容纳大文件”传输的程度。


当然,Nginx中也可以作为文件服务器使用,但需要用到一个专门的第三方模块nginx-upload-module,如果项目中文件上传的作用处不多,那么建议可以通过Nginx搭建,毕竟可以节省一台文件服务器资源。但如若文件上传/下载较为频繁,那么还是建议额外搭建文件服务器,并将上传/下载功能交由后端处理。

 

 

Nginx一网打尽:动静分离、压缩、缓存、黑白名单、跨域、高可用、性能优化...

# Nginx配置SLL证书

Nginx一网打尽:动静分离、压缩、缓存、黑白名单、跨域、高可用、性能优化...

 

随着越来越多的网站接入HTTPS,因此Nginx中仅配置HTTP还不够,往往还需要监听443端口的请求,但在上篇《HTTP/HTTPS》中谈到过,HTTPS为了确保通信安全,所以服务端需配置对应的数字证书,当项目使用Nginx作为网关时,那么证书在Nginx中也需要配置,接下来简单聊一下关于SSL证书配置过程:

 

  • ①先去CA机构或从云控制台中申请对应的SSL证书,审核通过后下载Nginx版本的证书。

  • ②下载数字证书后,完整的文件总共有三个:.crt、.key、.pem:

    • .crt:数字证书文件,.crt是.pem的拓展文件,因此有些人下载后可能没有。

    • .key:服务器的私钥文件,及非对称加密的私钥,用于解密公钥传输的数据。

    • .pem:Base64-encoded编码格式的源证书文本文件,可自行根需求修改拓展名。

  • ③在Nginx目录下新建certificate目录,并将下载好的证书/私钥等文件上传至该目录。

  • ④最后修改一下nginx.conf文件即可,如下:

# ----------HTTPS配置-----------server {    # 监听HTTPS默认的443端口    listen 443;    # 配置自己项目的域名    server_name www.xxx.com;    # 打开SSL加密传输    ssl on;    # 输入域名后,首页文件所在的目录    root html;    # 配置首页的文件名    index index.html index.htm index.jsp index.ftl;    # 配置自己下载的数字证书    ssl_certificate  certificate/xxx.pem;    # 配置自己下载的服务器私钥    ssl_certificate_key certificate/xxx.key;    # 停止通信时,加密会话的有效期,在该时间段内不需要重新交换密钥    ssl_session_timeout 5m;    # TLS握手时,服务器采用的密码套件    ssl_ciphers ECDHE-RSA-AES128-GCM-SHA256:ECDHE:ECDH:AES:HIGH:!NULL:!aNULL:!MD5:!ADH:!RC4;    # 服务器支持的TLS版本    ssl_protocols TLSv1 TLSv1.1 TLSv1.2;    # 开启由服务器决定采用的密码套件    ssl_prefer_server_ciphers on;
    location / {        ....    }}
# ---------HTTP请求转HTTPS-------------server {    # 监听HTTP默认的80端口    listen 80;    # 如果80端口出现访问该域名的请求    server_name www.xxx.com;    # 将请求改写为HTTPS(这里写你配置了HTTPS的域名)    rewrite ^(.*)$ https://www.xxx.com;}

OK~,根据如上配置了Nginx后,你的网站即可通过https://的方式访问,并且当客户端使用http://的方式访问时,会自动将其改写为HTTPS请求。

 

 

Nginx一网打尽:动静分离、压缩、缓存、黑白名单、跨域、高可用、性能优化...

# Nginx的高可用

Nginx一网打尽:动静分离、压缩、缓存、黑白名单、跨域、高可用、性能优化...

线上如果采用单个节点的方式部署Nginx,难免会出现天灾人祸,比如系统异常、程序宕机、服务器断电、机房爆炸、地球毁灭….哈哈哈,夸张了。但实际生产环境中确实存在隐患问题,由于Nginx作为整个系统的网关层接入外部流量,所以一旦Nginx宕机,最终就会导致整个系统不可用,这无疑对于用户的体验感是极差的,因此也得保障Nginx高可用的特性。

接下来则会通过keepalived的VIP机制,实现Nginx的高可用。
VIP并不是只会员的意思,而是指Virtual IP,即虚拟IP。

keepalived在之前单体架构开发时,是一个用的较为频繁的高可用技术,比如MySQL、Redis、MQ、Proxy、Tomcat等各处都会通过keepalived提供的VIP机制,实现单节点应用的高可用。

 

Keepalived+重启脚本+双机热备搭建

 

①首先创建一个对应的目录并下载keepalived安装包(提取码:s6aq)到Linux中并解压:

[root@localhost]# mkdir /soft/keepalived && cd /soft/keepalived[root@localhost]# wget https://www.keepalived.org/software/keepalived-2.2.4.tar.gz[root@localhost]# tar -zxvf keepalived-2.2.4.tar.gz

②进入解压后的keepalived目录并构建安装环境,然后编译并安装:

[root@localhost]# cd keepalived-2.2.4[root@localhost]# ./configure --prefix=/soft/keepalived/[root@localhost]# make && make install

③进入安装目录的/soft/keepalived/etc/keepalived/并编辑配置文件:

[root@localhost]# cd /soft/keepalived/etc/keepalived/[root@localhost]# vi keepalived.conf

④编辑主机的keepalived.conf核心配置文件,如下:

global_defs {    # 自带的邮件提醒服务,建议用独立的监控或第三方SMTP,也可选择配置邮件发送。    notification_email {        root@localhost    }    notification_email_from root@localhost    smtp_server localhost    smtp_connect_timeout 30    # 高可用集群主机身份标识(集群中主机身份标识名称不能重复,建议配置成本机IP)  router_id 192.168.12.129 }
# 定时运行的脚本文件配置vrrp_script check_nginx_pid_restart {    # 之前编写的nginx重启脚本的所在位置  script "/soft/scripts/keepalived/check_nginx_pid_restart.sh"     # 每间隔3秒执行一次  interval 3    # 如果脚本中的条件成立,重启一次则权重-20  weight -20}
# 定义虚拟路由,VI_1为虚拟路由的标示符(可自定义名称)vrrp_instance VI_1 {    # 当前节点的身份标识:用来决定主从(MASTER为主机,BACKUP为从机)  state MASTER    # 绑定虚拟IP的网络接口,根据自己的机器的网卡配置  interface ens33     # 虚拟路由的ID号,主从两个节点设置必须一样  virtual_router_id 121    # 填写本机IP  mcast_src_ip 192.168.12.129    # 节点权重优先级,主节点要比从节点优先级高  priority 100    # 优先级高的设置nopreempt,解决异常恢复后再次抢占造成的脑裂问题  nopreempt    # 组播信息发送间隔,两个节点设置必须一样,默认1s(类似于心跳检测)  advert_int 1    authentication {        auth_type PASS        auth_pass 1111    }    # 将track_script块加入instance配置块    track_script {        # 执行Nginx监控的脚本    check_nginx_pid_restart    }
    virtual_ipaddress {        # 虚拟IP(VIP),也可扩展,可配置多个。    192.168.12.111    }}

⑤克隆一台之前的虚拟机作为从(备)机,编辑从机的keepalived.conf文件,如下:

global_defs {    # 自带的邮件提醒服务,建议用独立的监控或第三方SMTP,也可选择配置邮件发送。    notification_email {        root@localhost    }    notification_email_from root@localhost    smtp_server localhost    smtp_connect_timeout 30    # 高可用集群主机身份标识(集群中主机身份标识名称不能重复,建议配置成本机IP)  router_id 192.168.12.130 }
# 定时运行的脚本文件配置vrrp_script check_nginx_pid_restart {    # 之前编写的nginx重启脚本的所在位置  script "/soft/scripts/keepalived/check_nginx_pid_restart.sh"     # 每间隔3秒执行一次  interval 3    # 如果脚本中的条件成立,重启一次则权重-20  weight -20}
# 定义虚拟路由,VI_1为虚拟路由的标示符(可自定义名称)vrrp_instance VI_1 {    # 当前节点的身份标识:用来决定主从(MASTER为主机,BACKUP为从机)  state BACKUP    # 绑定虚拟IP的网络接口,根据自己的机器的网卡配置  interface ens33     # 虚拟路由的ID号,主从两个节点设置必须一样  virtual_router_id 121    # 填写本机IP  mcast_src_ip 192.168.12.130    # 节点权重优先级,主节点要比从节点优先级高  priority 90    # 优先级高的设置nopreempt,解决异常恢复后再次抢占造成的脑裂问题  nopreempt    # 组播信息发送间隔,两个节点设置必须一样,默认1s(类似于心跳检测)  advert_int 1    authentication {        auth_type PASS        auth_pass 1111    }    # 将track_script块加入instance配置块    track_script {        # 执行Nginx监控的脚本    check_nginx_pid_restart    }
    virtual_ipaddress {        # 虚拟IP(VIP),也可扩展,可配置多个。    192.168.12.111    }}

⑥新建scripts目录并编写Nginx的重启脚本,check_nginx_pid_restart.sh:

[root@localhost]# mkdir /soft/scripts /soft/scripts/keepalived[root@localhost]# touch /soft/scripts/keepalived/check_nginx_pid_restart.sh[root@localhost]# vi /soft/scripts/keepalived/check_nginx_pid_restart.sh
#!/bin/sh# 通过ps指令查询后台的nginx进程数,并将其保存在变量nginx_number中nginx_number=`ps -C nginx --no-header | wc -l`# 判断后台是否还有Nginx进程在运行if [ $nginx_number -eq 0 ];then    # 如果后台查询不到`Nginx`进程存在,则执行重启指令    /soft/nginx/sbin/nginx -c /soft/nginx/conf/nginx.conf    # 重启后等待1s后,再次查询后台进程数    sleep 1    # 如果重启后依旧无法查询到nginx进程    if [ `ps -C nginx --no-header | wc -l` -eq 0 ];then        # 将keepalived主机下线,将虚拟IP漂移给从机,从机上线接管Nginx服务        systemctl stop keepalived.service    fifi

⑦编写的脚本文件需要更改编码格式,并赋予执行权限,否则可能执行失败:

[root@localhost]# vi /soft/scripts/keepalived/check_nginx_pid_restart.sh
:set fileformat=unix # 在vi命令里面执行,修改编码格式:set ff # 查看修改后的编码格式
[root@localhost]# chmod +x /soft/scripts/keepalived/check_nginx_pid_restart.sh

⑧由于安装keepalived时,是自定义的安装位置,因此需要拷贝一些文件到系统目录中:

[root@localhost]# mkdir /etc/keepalived/[root@localhost]# cp /soft/keepalived/etc/keepalived/keepalived.conf /etc/keepalived/[root@localhost]# cp /soft/keepalived/keepalived-2.2.4/keepalived/etc/init.d/keepalived /etc/init.d/[root@localhost]# cp /soft/keepalived/etc/sysconfig/keepalived /etc/sysconfig/

⑨将keepalived加入系统服务并设置开启自启动,然后测试启动是否正常:

[root@localhost]# chkconfig keepalived on[root@localhost]# systemctl daemon-reload[root@localhost]# systemctl enable keepalived.service[root@localhost]# systemctl start keepalived.service
其他命令:systemctl disable keepalived.service # 禁止开机自动启动systemctl restart keepalived.service # 重启keepalivedsystemctl stop keepalived.service # 停止keepalivedtail -f /var/log/messages # 查看keepalived运行时日志

⑩最后测试一下VIP是否生效,通过查看本机是否成功挂载虚拟IP:

[root@localhost]# ip addr

Nginx一网打尽:动静分离、压缩、缓存、黑白名单、跨域、高可用、性能优化...

从上图中可以明显看见虚拟IP已经成功挂载,但另外一台机器192.168.12.130并不会挂载这个虚拟IP,只有当主机下线后,作为从机的192.168.12.130才会上线,接替VIP。最后测试一下外网是否可以正常与VIP通信,即在Windows中直接ping VIP:

Nginx一网打尽:动静分离、压缩、缓存、黑白名单、跨域、高可用、性能优化...

外部通过VIP通信时,也可以正常Ping通,代表虚拟IP配置成功。

 

Nginx高可用性测试

经过上述步骤后,keepalived的VIP机制已经搭建成功,在上个阶段中主要做了几件事:

 

  • 一、为部署Nginx的机器挂载了VIP。

  • 二、通过keepalived搭建了主从双机热备。

  • 三、通过keepalived实现了Nginx宕机重启。

 

由于前面没有域名的原因,因此最初server_name配置的是当前机器的IP,所以需稍微更改一下nginx.conf的配置:

sever{    listen    80;    # 这里从机器的本地IP改为虚拟IP  server_name 192.168.12.111;  # 如果这里配置的是域名,那么则将域名的映射配置改为虚拟IP}

最后来实验一下效果:

Nginx一网打尽:动静分离、压缩、缓存、黑白名单、跨域、高可用、性能优化...

在上述过程中,首先分别启动了keepalived、nginx服务,然后通过手动停止nginx的方式模拟了Nginx宕机情况,过了片刻后再次查询后台进程,我们会发现nginx依旧存活。

从这个过程中不难发现,keepalived已经为我们实现了Nginx宕机后自动重启的功能,那么接着再模拟一下服务器出现故障时的情况:


Nginx一网打尽:动静分离、压缩、缓存、黑白名单、跨域、高可用、性能优化...

在上述过程中,我们通过手动关闭keepalived服务模拟了机器断电、硬件损坏等情况(因为机器断电等情况=主机中的keepalived进程消失),然后再次查询了一下本机的IP信息,很明显会看到VIP消失了!

现在再切换到另外一台机器:192.168.12.130来看看情况:

Nginx一网打尽:动静分离、压缩、缓存、黑白名单、跨域、高可用、性能优化...

此刻我们会发现,在主机192.168.12.129宕机后,VIP自动从主机飘移到了从机192.168.12.130上,而此时客户端的请求就最终会来到130这台机器的Nginx上。

最终,利用Keepalived对Nginx做了主从热备之后,无论是遇到线上宕机还是机房断电等各类故障时,都能够确保应用系统能够为用户提供7×24小时服务。

 

 

Nginx一网打尽:动静分离、压缩、缓存、黑白名单、跨域、高可用、性能优化...

# Nginx性能优化

Nginx一网打尽:动静分离、压缩、缓存、黑白名单、跨域、高可用、性能优化...

到这里文章的篇幅较长了,最后再来聊一下关于Nginx的性能优化,主要就简单说说收益最高的几个优化项,在这块就不再展开叙述了,毕竟影响性能都有多方面原因导致的,比如网络、服务器硬件、操作系统、后端服务、程序自身、数据库服务等,对于性能调优比较感兴趣的可以参考之前《JVM性能调优》中的调优思想

 

优化一:打开长连接配置

 

通常Nginx作为代理服务,负责分发客户端的请求,那么建议开启HTTP长连接,用户减少握手的次数,降低服务器损耗,具体如下:

upstream xxx {    # 长连接数    keepalive 32;    # 每个长连接提供的最大请求数    keepalived_requests 100;    # 每个长连接没有新的请求时,保持的最长时间    keepalive_timeout 60s;}

优化二、开启零拷贝技术

 

零拷贝这个概念,在大多数性能较为不错的中间件中都有出现,例如Kafka、Netty等,而Nginx中也可以配置数据零拷贝技术,如下:

sendfile on; # 开启零拷贝机制

零拷贝读取机制与传统资源读取机制的区别:

 

  • 传统方式:硬件–>内核–>用户空间–>程序空间–>程序内核空间–>网络套接字

  • 零拷贝方式:硬件–>内核–>程序内核空间–>网络套接字

 

从上述这个过程对比,很轻易就能看出两者之间的性能区别。

 

优化三、开启无延迟或多包共发机制

 

在Nginx中有两个较为关键的性能参数,即tcp_nodelay、tcp_nopush,开启方式如下:

tcp_nodelay on;tcp_nopush on;

TCP/IP协议中默认是采用了Nagle算法的,即在网络数据传输过程中,每个数据报文并不会立马发送出去,而是会等待一段时间,将后面的几个数据包一起组合成一个数据报文发送,但这个算法虽然提高了网络吞吐量,但是实时性却降低了。

因此你的项目属于交互性很强的应用,那么可以手动开启tcp_nodelay配置,让应用程序向内核递交的每个数据包都会立即发送出去。但这样会产生大量的TCP报文头,增加很大的网络开销。

相反,有些项目的业务对数据的实时性要求并不高,追求的则是更高的吞吐,那么则可以开启tcp_nopush配置项,这个配置就类似于“塞子”的意思,首先将连接塞住,使得数据先不发出去,等到拔去塞子后再发出去。设置该选项后,内核会尽量把小数据包拼接成一个大的数据包(一个MTU)再发送出去.

当然若一定时间后(一般为200ms),内核仍然没有积累到一个MTU的量时,也必须发送现有的数据,否则会一直阻塞。

tcp_nodelay、tcp_nopush两个参数是“互斥”的,如果追求响应速度的应用推荐开启tcp_nodelay参数,如IM、金融等类型的项目。如果追求吞吐量的应用则建议开启tcp_nopush参数,如调度系统、报表系统等。

注意:
①tcp_nodelay一般要建立在开启了长连接模式的情况下使用。
②tcp_nopush参数是必须要开启sendfile参数才可使用的。

 

优化四、调整Worker工作进程

 

Nginx启动后默认只会开启一个Worker工作进程处理客户端请求,而我们可以根据机器的CPU核数开启对应数量的工作进程,以此来提升整体的并发量支持,如下:

# 自动根据CPU核心数调整Worker进程数量worker_processes auto;

工作进程的数量最高开到8个就OK了,8个之后就不会有再大的性能提升。

同时也可以稍微调整一下每个工作进程能够打开的文件句柄数:

# 每个Worker能打开的文件描述符,最少调整至1W以上,负荷较高建议2-3Wworker_rlimit_nofile 20000;

操作系统内核(kernel)都是利用文件描述符来访问文件,无论是打开、新建、读取、写入文件时,都需要使用文件描述符来指定待操作的文件,因此该值越大,代表一个进程能够操作的文件越多(但不能超出内核限制,最多建议3.8W左右为上限)。

 

优化五、开启CPU亲和机制

 

对于并发编程较为熟悉的伙伴都知道,因为进程/线程数往往都会远超出系统CPU的核心数,因为操作系统执行的原理本质上是采用时间片切换机制,也就是一个CPU核心会在多个进程之间不断频繁切换,造成很大的性能损耗。

 

而CPU亲和机制则是指将每个Nginx的工作进程,绑定在固定的CPU核心上,从而减小CPU切换带来的时间开销和资源损耗,开启方式如下:

worker_cpu_affinity auto;

优化六、开启epoll模型及调整并发连接数

 

在最开始就提到过:Nginx、Redis都是基于多路复用模型去实现的程序,但最初版的多路复用模型select/poll最大只能监听1024个连接,而epoll则属于select/poll接口的增强版,因此采用该模型能够大程度上提升单个Worker的性能,如下:

events {    # 使用epoll网络模型    use epoll;    # 调整每个Worker能够处理的连接数上限    worker_connections  10240;}

这里对于select/poll/epoll模型就不展开细说了,后面的IO模型文章中会详细剖析。

 

 

Nginx一网打尽:动静分离、压缩、缓存、黑白名单、跨域、高可用、性能优化...

# 放在最后的结尾

Nginx一网打尽:动静分离、压缩、缓存、黑白名单、跨域、高可用、性能优化...

 

至此,Nginx的大部分内容都已阐述完毕,关于最后一小节的性能优化内容,其实在前面就谈到的动静分离、分配缓冲区、资源缓存、防盗链、资源压缩等内容,也都可归纳为性能优化的方案。

作者:竹子爱熊猫

来源:juejin.cn/post/7112826654291918855

不败而后战,《孙子兵法》里的投资之道

来源 | 整理自《华杉讲透孙子兵法》

比起抓住每一次投资机会,投资中更重要的是避免出现永不可逆的失败。这是所有专业投资人的立根之本,也与《孙子兵法》中“先胜而后战”的思想精髓不谋而合。

近日,电视剧《狂飙》的热播,剧中人物对《孙子兵法》的钻研,也让广大观众对《孙子兵法》燃起了兴趣。当你耐心阅读《孙子兵法》,会发觉大道至简。

《孙子兵法》讲的不仅仅关于胜,更是关于不败;不仅仅是对外界的形、势的认识,更是对自己的认知,“不可胜在己,可胜在敌”。这在投资中,也非常有指导作用。投资的本质是认知的变现,而认知世界必先从认知自己开始。认知自己,才能赚到能力圈内的钱,才能不被波动的市场诱惑,才能避免发生永不可逆的损失。长期如此,方可不败。

作为投资者,如何更好地读懂《孙子兵法》?本文分享《华杉讲透孙子兵法》一书中,最后总结《孙子兵法》的9条思想精要,希望大家开卷有益。

 

01
孙子兵法是讲以强胜弱,不是讲以弱胜强

《孙子兵法》第一篇讲“计”,不是奇谋巧计,是计算的计,是现代的SWOT分析(优劣势分析法):优势、劣势、威胁、机会。庙算,就是在决定是否开战之前,在家里衡量计算双方政治、经济、军事实力对比,“五事七计”,从五个方面,七个科目,进行打分。分多的胜,分少的败。打完分,就能知胜,叫“多算胜,少算不胜”。

知胜,算下来能赢,而后可以兴师动众,打。

算下来自己分数没别人高,就不要战。所以孙子是不相信以弱胜强,那是小概率事件。“兵者,国之大事,死生之地,存亡之道,不可不察也”,孙子不会拿国家民族的命运,去赌小概率事件。

02
打得赢,也要算代价
 
 

行动必有代价,战争代价极大。不要光想着战胜,要算账,值不值得。李克说魏文侯“数胜必亡”,胜仗打多了,国家反而要灭亡。因为数战则民疲,数胜则主骄。以骄傲之主,率领疲惫之民,这国家就要亡了。

汉武大帝,就演绎了主骄民疲的一生,何其霸气!汉武帝一生开疆拓土,武功赫赫,结果呢?中国从政府到民间,全部破产,国家差点都给他搞亡国了,晚年迫于巨大政治压力,下轮台罪己诏,批评自己“朕即位以来,所为狂悖,使天下愁苦,不可追悔”。

03
先胜后战,赢了再打

《孙子兵法》主要是自强之法,首先是修炼自己,而不是惦记打败别人。

孙子说:“善战者,先为不可胜,以待敌之可胜。不可胜在己,可胜在敌”,“胜可知,而不可为”。又说“善战者先胜而后战”,要胜中求战,不要战中求胜。

先修炼自己的筋骨,让自己成为不可战胜的,让自己没漏洞,然后等敌人出漏洞。如果敌人不比我们弱小,或者和我们强弱差不多,而且他没失误,没漏洞,就不能打。“可胜在敌”,就在于他什么时候失误。

敌人不失误,我们就没法赢。

所以胜负可以预知,可以判断,但不能强求。胜机一现,抓住机会就打。不能反过来,冲上去就打,在打的过程中找胜机,那就危险了。

04
要能等待,能忍耐

现在人们常说“不作死,就不会死”。《孙子兵法》讲得最多就是这个。战争这东西,收益和代价极不对等。打赢了,杀敌一千,自伤八百,不一定有多大利益。

打输了,则可能国破家亡,命都没了。所以关键是要能等,不能因为焦虑,就频频动作。

哥舒翰守潼关,知道不能打,他能等,但唐明皇焦虑,不能等,逼他出关作战,就全军覆没了。

秦国王翦伐楚,他就能等,又能安抚秦始皇,让秦始皇也不着急,他就把六十万大军开到楚国境内,扎营练兵,天天开运动会,等得楚国人焦虑了,动作了,露出破绽了,他一举就把楚国灭了。

等待在很多情况下都是最好的战略。但人们往往认为等待是不作为,是不可接受的。

要有这个认识:一辈子“不作为”也是可以接受的。因为“作为”的结果可能是死。

比如日本德川家康,他是最能等待,最能忍耐,也最能妥协。织田信长在,他是小兄弟;丰臣秀吉在,他是大诸侯。他有没有志在必得,一定要得天下呢?没有。

他可以等,等不来,他可以妥协,丰臣家族强,他可以一直做诸侯。结果大哥们都没他命长,都先死了,没人能拦住他了,他还在丰臣秀吉死后,又等了十七年,才稳稳当当夺了天下。

他的家族,就统治了日本两百多年。

05
一战而定,胜而不定,则胜利无意义

胜利是手段,不是目的,目的是平定。

如果打了胜仗,但不能平定,都百战百胜了,还要接着打,那打那一百场胜仗干什么?打胜仗也要死人。就算死的是敌人的人,也不如他不要死,收服他,加入我们,才能胜敌而益强。

孙子有很强的保全思想,保全自己,保全人民,保全城池,保全财产,最好也保全敌人,都收服了归我所有。这才叫平定天下。

战国时赵国李牧守边,防御匈奴,他就紧闭关门,只是练兵,数年不出战,赵王不满,换一个将领去,上任一年多,烽火连天,天天打仗,打得边境地区汉人无法耕种,匈奴无法放牧,双方死伤惨重,冤冤相报,永无宁日。

赵王无奈,再派李牧去,他又挂上免战牌,隔绝接触,边境数年无事,匈奴也抢不到东西,渐渐懈怠了。李牧突然大举进兵,一战灭了匈奴十几万人,平定边关,得十几年安宁。

06
以正合,以奇胜,分战法是基本战术原则

“以正合,以奇胜”。这句《孙子兵法》最为人熟悉的话,前面书中详细用多个战例讲了,那“奇”字,念jī,不念qí,是奇数偶数的奇,又称余奇,就是多出来的部分,就是预备队,就是手里捏着还没打出去的牌,留到关键的时候,打出去,制胜。

这叫分战法,是最基本的战术原则,凡作战,一定要分兵,有一百万人,要分兵。项羽到了最后乌江边,只剩二十八骑,也要分兵,首尾相顾,不能挤成一团打。

韩信背水一战,不是真的把所有部队都布阵在水边背水一战,那就真给敌人撵河里喂鱼了。他先分了奇兵出去埋伏着,关键时候杀出来,这才获胜。

人们老相信奇袭得胜,以少胜多,还是侥幸心理,老想使巧劲。孙子告诉你,兵法没有侥幸,弄巧必成拙,必须要按军事规律,按兵法套路来。

07
诡道不重要
 

“兵者,诡道也。”《孙子兵法》里这句话,误了好多人,以为《孙子兵法》就是三十六计,就是诡诈取胜。

诡诈归诡诈,但人家不上套,你再诡诈也没用。诡诈在兵法里,不是主要部分。现在好多出版社把《孙子兵法与三十六计》合成一本书,似乎兵法就是奇谋巧计,这是误区。

08
知己知彼,关键是知己

“知己知彼,百战不殆”。人们念着这句话,就老想去知彼,以为知己不是问题。我自己,我还不知道吗?

其实知己知彼,关键在于知己。因为不可胜在己,自己强大了,自己不失误,别人就无奈你何。千方百计去知彼,可能还正着了别人的诡道。

《孙子兵法》,讲来讲去,都是练基本功,抓基本面,就是管好你自己,自己强了,再等待胜机出现,等最有把握的时候动手。先胜后战,一战而定。

自己不强,那就不要逞强。

09
孙子兵法不是教你打赢,首先是教你认输
 

为什么人们都喜欢听“永不服输”,因为人们不爱听坏消息,不愿意听到对自己不利的真相。“认输才会赢!”额,这句话人们还勉强可以接受,因为结果还是赢嘛。

假如结果也没有赢,还是输呢?

你能不能接受失败呢?

在你真正去学习《孙子兵法》之前,你可能以为那是一部胜战秘笈。它当然也是,胜战秘笈,全在这里,不过如此。

但是,如果你在这兵法中,学会了接受失败,你才真正进入了智慧之门。

-全文完-

转自:https://mp.weixin.qq.com/s/ouHt9IgWBA6X1TZLtmlRpg

如何系统地学习股票投资?

简要提示:

前半部分是渔(1-6),主要讲怎么建立起正确的投资理念。
后半部分是鱼(7-8),主要讲A股各行业都有哪些值得长期投资的好公司。
如何系统地学习股票投资?

1. 长线投资,本质是投资国运。

① 诚实是做投资最优良的品格

我写的文章,除非有系统风险,否则从来不删,无论对错都会放在这里。
菜头不是一个喜欢做马后炮的人,敢于诚实面对自己,是一个通往优秀投资人的必经之路。
这也是菜头特别希望大家做投资能做到的一个点,价值投资的鼻祖格雷厄姆先生在《聪明的投资者》开篇就说到——
要想一生中获得投资成功,并不需要顶级的智商、超凡的商业头脑或内幕消息,而是需要一个稳妥的知识体系作为决策基础,并且有能力控制自己的情绪,使其不会对这种体系造成侵蚀。
在菜头看来,能够控制自己情绪最关键的点,就是必须对自己诚实,敢于承认自身的局限和无知,是建立稳定的知识体系的必要素质。
同时,要想稳定获利,还需要一个稳定向上的社会环境,比如一个人要是生活在伊拉克或者叙利亚,想要靠股市投资长期赚钱,无异于异想天开。
巴菲特滚雪球的关键,不仅有自身的勤奋和智慧,更重要的是,经过1929年大萧条之后,从1954年往后的70多年里,美国大部分时间处于低通胀高增长的国运鼎盛期。
无论是彼得林奇还是巴菲特,亦或是其他投资大佬的成功,都是建立在这个基础上的。
这既是时代的机会,也是时代的局限性,只有搞明白了这个前提,才能读懂后面的内容。

② 中国国运

我们生活在(中国)一个伟大的时代,这个时代有太多高速成长的公司,这些公司就好比一辆辆高速奔跑的列车,任何一个时间点你踏上车,都会带你走得很远。
这就是菜头经常说的,生在一个经济持续保持稳定增长的国家,做投资只要你不去瞎折腾,是想亏钱都难的。
中国的百年复兴,才刚刚开始!
大概率,我们这一代人,是可以不用下车了。多么幸福而美好的时代啊!就让我们共同成长,一起享受这美好(投资)生活吧!
下面,开始正式讲股市,当然,在讲知识之前,首先跟大家推荐几本值得大家长期反复阅读的书籍,这个可能大家比较关心。

③ 投资书籍

有很多人经常留言问菜头,有没有什么值得看的投资(炒股)方面的书籍,说实话,菜头累计看过的关于投资方面的书,不算少,但是值得反复阅读的书,也就那么几本。
我们在市场上看到的大多数投资类图书,甚至包括一部分畅销书,多数时候,仅仅是把这些大佬的经典著作用废话再说一遍而已。
下面就先推荐几本菜头认为比较经典的书吧,就不放链接了,喜欢看书的伙伴可以自行购买,也可以到菜头公号【菜头日记】的首页发送【大礼包】三个字免费领取电子版。
《股票大作手回忆录》,讲述了天才投资人利弗莫尔一生的投资故事,看完之后会发现,我们当前面临的风浪,比起利弗莫尔一生大起大落所经历的事情,啥也不是。更重要的是,就这么一位大神,最后一把却赌输了。心灰意冷之下,这哥们一枪把自己蹦了,敬畏市场,是一辈子的事情。
❷ 格雷厄姆的《聪明的投资者》《证券分析》,价值投资界的圣经,值得反复阅读,再过50年都不会过时。
❸ 芒格的《穷查理宝典》,理论、技术和心理分析都有,尤其是投资行为学方面的研究,鼻祖级别的。
《彼得林奇三部曲》,详细地阐述了低卖高卖的原则(PEG估值法)。
《一本书读懂财务报表》,清华大学美女教授肖星的大作,适合新人阅读
不过呢,在讲技术之前,我再给大家讲个故事,百年股市,千篇一律,很多历史,就是往返重复的。
同时也告诉我们,太阳底下,很少有什么新鲜事发生,很多人每天津津乐道的那点所谓的内幕消息,早在几百年前就有了。
如何系统地学习股票投资?

2. 一个疯狂而悲伤的炒股惨案

① 牛顿大神炒股

我们知道,现代金融的起源,是从英国开始的,因为当时的英国,出了两个比上帝笨不了多少的人,一个叫亚当斯密,而另外一个,叫牛顿。
话说时间回到300多年前,英国出现了疯狂的股市投机浪潮。
这时候,一个无名小辈创建了一家空壳子公司。
这家公司,叫做南海公司,当然,与我们的南海没啥关系,这家公司从成立开始,至始至终就没有人知道是干什么的(实际上这家公司除了收钱外,确实也什么事情都没有做)
奇怪的是,当时的人,却争先恐后地疯抢南海公司的股票。
于是呢,南海公司一时间股价飙升,涨幅惊人,这件事情很快传到了大神牛顿耳边。
聪明的牛顿同学一看股市这么赚钱,摸了摸口袋,也跟着大家买了7000英镑南海公司(1720年的7000英镑=…算了,不跟牛顿比了)。
仅仅2个月,南海公司的股价又翻倍了,牛顿同学作为著名的科学家和金融学大家,还是比较严谨的,所以选择了落袋为安,把手中的股票掉后,一下就赚了7000英镑。
没过多久,聪明的牛顿就后悔了,因为刚刚把股票卖掉,南海公司又翻倍了。
于是,耐不住诱惑的牛顿先生,又杀了进去。
很快,股价又翻了8倍,牛顿身兼蓝星最牛X的科学家和金融学两大家的超级牛人,仅仅用了0.03秒钟的时间,就把帐算明白了,这生意简直太划算了,于是,又加大了投入。

如何系统地学习股票投资?

后来的故事,大家都知道了。
当然是南海公司破产,牛顿大神血本无归。
你可能会问我,你说的是同一个牛顿吗?没错,我说的就是那个被苹果砸脑袋上教我们万有引力的牛顿,就是那个奠定了金本位基础留着方便面发型的牛顿,那个担任英国皇家造币厂厂长的牛顿爵士啊!
从南海公司成立开始,自始至终没有人知道这是一家什么公司,但认购时近千名投资者争先恐后把大门挤倒。
尽管也没有多少人相信他真正获利丰厚,但大家却一致认为,会有更大的笨蛋会出现,股价会一直上涨,自己肯定能赚到钱。
后来,牛顿反思的时候感叹道:“我能计算出天体运行,但人们的疯狂实在难以估计。”
再后来,聪明的人们,把这种行为,称之为博傻理论。

② 博傻理论

博傻理论(greater fool theory),是指在资本市场中(如股票、期货市场):人们之所以完全不管某个东西的真实价值而愿意花高价购买,是因为他们预期会有一个更大的笨蛋会花更高的价格从他们那儿把它买走。博傻理论告诉人们的最重要的一个道理是:在这个世界上,傻不可怕,可怕的是做最后一个傻子。
博傻,是金融投机非常重要的基础要素,是好东西。
因此,对市场的敬畏,是股票投资者的必修课。
如何系统地学习股票投资?

3. 怎么选好公司

怎么从A股4000多只股票里,寻找优秀的好公司!

截止当前(2021.12月20日),沪深两市一共有4644只股票在交易。那么,怎么才能在这4000多只股票里,选出心仪的股票 ?
首先声明,本文不荐股,也不对结果承担任何责任,仅仅是希望这个选股的过程和思路,对您有所启发。
因此,结果不是菜头关心的,思路才是。
况且,历史的数据,不代表未来。
下面,正式开始答题:
我们先来看下,有哪些因素决定一个公司的价值 ?
❶ 企业的好坏最终就一个指标,能不能为股东赚到钱?持续地赚到钱?(营收和利润持续增长)
❷ 第二个指标就是赚到这些钱需要投入多少钱?(投入资本回报率,ROIC)
❸ 企业的存量资产能够获得多少回报,股东权益资产能够获得多少回报?(资产收益率和净资产收益率,ROE)
❹ 企业的钱是怎么来的,是股东投的?利润积累的还是借的?(负债率)
然后根据上面的方法,菜头一共选出来293家符合要求的公司。
PS: 全部完整293家公司,关注 CT600519『菜头日记』,发送“293”三个数字(并且会定期更新MSCI中国股票池名单,欢迎关注)。
你看,经过菜头这么一筛选,是不是大部分好公司都筛选出来了,当然,还是那句话,指标是静态的,公司是动态的,历史不代表未来。
上面是菜头经常用到的选股方式之一。当然,每个人的交易系统不同,我们可以通过设置一定的条件,先筛选出符合条件的公司,然后在进行精选,就会减少很多工作量。
关注财务数据的最大意义在于,上市公司一两个指标可以调节或者作假,但是同时满足多个指标,作假调节的难度就会成倍增加。养成看财报的习惯也许不能让你发财,但是大概率可以排雷,万变不离其中,公司的业绩,才是决定公司长期价值的唯一要素。
当然,财务指标不是万能的,哪怕是这么多指标,选出来的公司,也有可能暴雷,下一步,就是在这些公司里面,找出的自己能力圈内,可以理解的公司。
投资有一个非常重要的原则就是,不懂的公司不投,这也是巴菲特大神长期强调的。
如何系统地学习股票投资?

4. 新手需要关注的问题

① 流行的MACD选股法

然后,再回答新手比较关心的技术交易环节:
前些年,大家比较热衷于江恩,下面的部分,你可能根据你自己关心的内容,跳着看。
当然,这些年,菜头个人很少关注技术指标了,随着年龄的增加,你会发现,企业的基本面,远比研究技术要靠谱很多。
不过一些诸如MACD之类异步移动平均线,对于短期情绪的引导和趋势的观察,是非常有用的,大多数时候,得结合基本面一起观察,准确率更高。
MACD,全称是:Moving Average Convergence and Divergence;即平滑异动平均线。最早于20世纪70年代末杰拉尔德·阿佩尔创造的股票价格技术分析中使用的一个交易指标,显示趋势的强度、方向、势头和持续时间的变化。关于MACD的计算方式和各种指标的含义,菜头就不写了,网上到处都有,我今天要讲的是,技术背后的形成逻辑。什么是技术背后的形成逻辑呢,这就涉及到技术指标的反身性。
反身性理论最早由社会学家William Thomas提出,后由同为社会学家的Robert Merton完善。最后,索罗斯在《金融炼金术》一书中,完整地表述了交易对象之间的相互影响,从而说明股市的不可预测性。通俗意思就是,你在做决定的同时,这个决定本身,也会影响其他人的行为,而其他人的行为,又会反过来影响你的决定。
理解了这些,对于理解技术指标对交易行为的影响,就更加容易一些。
简单来说,就是一个指标,尤其是一些大家都高度认可的指标,一旦形成,就会反过来影响人的行为,达成一致预期。一致预期的形成,又会加速验证技术指标的形态,直到形态(趋势)反转,形成反向指标。比如我们经常讲到的金叉理论,就是在MACD底部区域,形成KDJ交叉的态势,如下图:

如何系统地学习股票投资?

上面是比亚迪MACD在负轴形成二次金叉的K线形态,所以股价在日K先年线附近,形成反转态势。
从这个角度看,技术指标,好像非常有用,确实如此,并且你还可以看出,在年线附近金叉之后,成交量立马放大,股价强势反转。
很难说,是技术影响了行为,还是行为反过来形成了技术的态势。
相互影响吧 。
上面说的,有一个非常重要的前提,就是整个大的趋势,要配合才行。
比如比亚迪(股票)的反转,和整个新能源板块的走势,以及科技股板块的走势,是一致的。否则的话,同样的案例,就有可能形成相反的走势,比如下图:

如何系统地学习股票投资?

同样是比亚迪,在2018年上半年的走势图,MACD多次金叉,但是由于整个行情不好,所在的新能源汽车板块也是一路下行,所以每一次反弹,都不及上一次的高点。
我们把这种情况,称为破位。
那么由于股市的不可预测性,你不知道整体行情是底还是顶,这是事后才能知道的。这就意味着,在整个熊市阶段,大多数技术指标,都是失效的。
变得不可交易。

② 安全边际

再就是必须要学会坚守安全边际,下面这段话,是我跟圈内以为私募的基金经理的聊天纪录,大家会从中得到很多启发:
如何系统地学习股票投资?如何系统地学习股票投资?
这就是市场非常残酷的地方,当然,对于聪明的投资者来讲,也是机会。

③ 滚雪球

菜头又不是专门为了写文章吓唬人的,对吧。
解决之道是什么呢?其实很简单:

如何系统地学习股票投资?

没错,需要有源源不断的雪花,才能把雪球滚起来,否则雪球就会融化。
雪花——民间俗称水龙头。
说人话就是,炒股,你要有源源不断的外围收入,才有可能把雪球滚起来,最终通往财富自由之路。
把上面的事情做好了,你才有机会,长期战胜市场。否则,失败,就是必然。
如何系统地学习股票投资?

5. 怎么选择证券公司

这部分内容涉及到合规的问题,文章末尾有提示。
如何系统地学习股票投资?

6. 值得长期持有的公司。

》》》贵州茅台和长江电力;不想关注贵州茅台和长江电力的童鞋,可以直接跳到第7部分。
投资茅台和长江电力的总结:
茅台和长江电力,都属于可以买了一直拿着的公司,茅台的的利润增速包含提价和产能扩张两个部分。并且茅台的窖池(资产)实际价值会随着时间的推移而稳定增值,最大的风险在于品牌护城河坍塌,以及类似于塑化剂这样的不可抗力的行业系统性风险。
长江电力的利润受到发电量和上网电价两个方面因素的影响,利润增速来源于新建电站和折旧到期所释放出来的利润。行业风险相对于茅台更小,但是天花板更明显。
本文不涉及到股价和估值的部分,仅仅是详细阐述这两家公司的底层投资逻辑,投资有风险,但是这两家公司的长期投资风险,已经无限趋近于零了。
如何系统地学习股票投资?

7. 宏观选股

下面,接着讲新手怎么寻找好公司,干货很多,同样值得你反复阅读。
首先菜头想说的是,要判断短期的涨跌,以及个股的走势,是一件非常不容易做到的事。
因为所有书籍都告诉我们,股市短期是投票机,主要由情绪和资金来驱动。
只有拉长了看,才能给企业称重——价格会围绕价值上下波动,但是有时候也会偏离很远。
如果我们把时间拉长到10年或者更长,确定性就出来了。
第一个确定性,也是最重要的确定性,当然就是下面这份文件(不接受反驳)[1]

如何系统地学习股票投资?

我们在这份文件的指导下,来为大家寻找,有哪些确定性的投资机会。
在文件提到的10多个重点产业中,菜头重点为大家在永续经营产业里面,去寻找一些好的公司。
首先,当然是优选消费和医药产业。
吃喝玩乐和生老病死,是每个人都绕不过去的主题。

① 镇楼资料(请悄悄保存)

如何系统地学习股票投资?

好吧,就上面这张图片,都值得你双击屏幕点个赞吧。
当然,放在图片里面的公司,大多数都涨得较高了,下面再来为大家,寻找一些被市场忽略的公司。

② 吃喝行业的投资机会

首先从吃喝中的白酒说起:
关于白酒的,菜头之前写过详细分析,白酒当前已经上升到信仰的层面了,如果不考虑价格的话,菜头当然是主推茅五泸汾四大金刚了。
其中,茅台具有一定的金融属性,当之无愧的老大,但是当前价位买茅台,需要信仰加持,这个菜头给不出建议,见仁见智。
五粮液的酒,卖出去,大多数都被喝掉了,要说高端品牌的潜力,能够让大家把一千多块钱一斤的兑水乙醇全部喝掉,还真需要本事。
所以如果仅仅从消费本身,不考虑金融属性来讲,五粮液的潜力是无限的。
老窖和汾酒是前两届名酒评选的老四大,江湖地位摆在那里,再加上这两年混改比较成功,新品快速全国化推广,释放了业绩,也是不错的。
当然,最大的问题还是,这两年白酒股价涨得太高,股价都不便宜。
其次就是二线白酒的机会,这个也是刚需,毕竟老百姓不能天天喝茅台。
二线白酒有明显的地域特征,它有两个成长逻辑,一是跟随一线白酒涨价,二是跨区域的拓展
在二线白酒里,洋河股份前些年发展不错:江苏省内白酒龙头,当前正在加速布局全国,但是最大的问题是,名气没有老四大高,在白酒高端化洗牌的过程中,比较吃亏,提价能力略次于老四大。
湖南的酒鬼酒:是八大香型中馥郁香型白酒第一品牌,子品牌内参不断跻身高端品牌。
三线白酒:顺鑫农业:牛栏山二锅头通过大规模铺设渠道,已经成功超越红星二锅头,成为国民二锅头头牌。
老白干酒是状元中学(衡水)边上的品牌:独有的老白干香型二锅头,在河北地区销量不错,也在向全国发展。

下面再说喝的和厨房用的:
前面那几家,都涨很高了。
相对来说,伊利的估值,是上面几家里面,相对合理的。
乳制品是人体重要的蛋白质来源,我国目前人均乳制品消费量只有亚洲平均水平的2/3,跟欧美相去甚远,所以提升的空间还很大。
乳制品具体可分为常温奶,低温奶,奶粉和奶酪。
常温奶不容易坏,拼的是上游奶牛场资源和运输渠道。伊利和蒙牛是绝对的霸主。
低温奶添加的防腐剂少,更加新鲜,毛利率也更高,但有运输半径的限制,呈现出地域性。比如,光明乳业就牢牢占据了长三角地区。
奶粉方面,中国飞鹤是奶粉龙头,主要面向二三线城市,抓住宝妈们买贵就是买好的心理,卖出了比国外奶粉更高的毛利。
贝因美本来质量是非常不错的,但是因为公司管理问题,最近几年没落了。
奶酪是个增长很快的细分市场,奶酪渗透率正快速上升,妙可蓝多抓住机遇,成为这个赛道的龙头。
下面再说说,休闲食品
随着消费升级,休闲食品的消费也越来越高,行业每年保持15%以上的增长。
桃李面包:短保质期面包龙头
安琪酵母:酵母是烘焙的必需添加剂,市场需求极大,而且行业对安全要求极高,构成了很高的壁垒,安琪酵母是行业寡头。
洽洽食品、盐津铺子:主打瓜子的传统零食零售店。
三只松鼠、良品铺子:零食界新秀,走互联网销售路线。良品铺子定位高端,三只松鼠更加亲民
农夫山泉:凭借一句“大自然的搬运工”,农夫山泉成为了“水茅”,创始人也一度成为中国首富,下来了,看样子过几天可能又上去了。
休闲食品还有很多线上线下融合的机会,以及传统渠道也可能出圈,就比如前年出圈的辣条,把垂直单品做成了上百亿估值的生意。
这样的机会,未来还会有很多,需要火眼金睛去寻找。
调味品:
“油、盐、酱、醋”是老百姓最基本的刚性需求。
从邻国日本消费升级的20年经验来看,调味品规模上涨了8倍,几乎是增速最快的领域
我国调味品市场规模同样增长迅速,而行业集中度又远低于日本,这也意味着行业龙头还有很大的成长空间。
海天味业、中炬高新、千禾味业:酱油龙头,酱油是调味品里最大的赛道,海天味业的市值曾超过万科+保利的总和。
恒顺醋业:醋业龙头,醋是调味品里仅次于酱油的第二大赛道。
金龙鱼:米面油龙头,米面油属于国计民生的产业,国家严格控价,毛利率比酱油低很多。
涪陵榨菜:榨菜龙头,也被当成经济的反向指标

③ 玩乐行业的投资机会

下面说玩的。
在娱乐至死的年代,玩当然是很重要的事情。
如何系统地学习股票投资?
不过大多数头部企业,都在境外上市。
腾讯是我最看好的公司之一,之前我写文章也说,如果实在不知道买什么,就买腾讯吧,现在这个观点依然没变。
在我看来,腾讯的开放赋能,不寻求控股的投资策略,和阿里追求控股垄断,是一条不同的方向,在未来开放是大趋势的环境下,我更看好前者。
当然,资本市场,也已经给出了答案。

③ 与“生”相关的投资机会

然后,再说“生”的问题,医药当然是重点。

如何系统地学习股票投资?

除了上面图片里面的从生到“生”的机会外,创新药的发展,也是值得重点关注的。
尤其是2015年集采政策推出之后,这个影响是持续的。
创新药
创新药领域经常出现爆款单品的现象,研发一个成功的大单品,加上专利的保护,足以养活一家几百上千亿市值的公司。
当然,也有用力过猛的,比如著名的吉利德公司,发明的丙肝神药彻底治愈了丙肝,结果病人没了,自己的生意也黄了。
看创新药企业,除了看它的成熟药品,还要重点关注正在研发中的药品和进度,也就是业内俗称的管线,因为这些才是业绩增长的根本来源。
恒瑞医药:创新药龙头,肿瘤病和心血管病是创新药最大的市场,恒瑞是最大的抗肿瘤药生产商,主要针对胃癌、乳腺癌。
贝达药业:深耕肺癌领域,在研药品数量非常多。
君实生物:深耕鼻咽癌和肺癌领域,仍处于商业化早期。
中国生物制药、瀚森制药、信达生物、百济神州:抗肿瘤细分龙头,但都在港股上市。
华海药业、天宇股份:心血管疾病原料药生产龙头。
人福医药:麻醉剂绝对龙头。几年前有所膨胀,收购安全套厂家杰士邦,结果股价一落千丈。之后重新聚焦主业,股价迅速反弹。
杜蕾斯:还是要摆正位置。
康弘药业:眼科血管疾病细分赛道龙头
甘李药业:治疗糖尿病类胰岛素的生产龙头
华东医药:业务横跨创新药、医药流通和医美,但创新药能力一般。
复星医药:业务广,什么都做一些,国际化程度不错。
新和成:这个严格来说并不是创新药,但它是维生素生产的龙头。
另外,医药产业链分工也越来越成熟,外包服务也在逐渐形成规模。
随着专业度的提升,外包也越来越精细化,具体可分为研发外包(CRO)、生产外包(CMO)、定制研发生产外包(CDMO),这些都统称CXO。
药明康德:综合性的医药研发外包龙头,覆盖CRO和CDMO领域。
康龙化成:CRO行业龙头
泰格医药、昭衍新药:临床前CRO行业龙头
药石科技:药物分子砌块领域CRO龙头
凯莱英:小分子制药CDMO行业龙头
药明生物:大分子药物CDMO龙头
普洛药业:专注CDMO领域
博腾股份:CMO行业龙头
中药:重点推云南白药和片仔癀,但是股价都不低。
疫苗类:重点看二类苗。
智飞生物:靠独家代理HPV疫苗,成为疫苗一哥。
康泰生物:肺炎和狂犬疫苗生产龙头
沃森生物:主打肺炎疫苗和HPV疫苗。
华兰生物:血液制品生产商,切入流感疫苗领域。
医疗器械:
迈瑞医疗:全国最大的医疗器械公司,主要从事呼吸机、监护仪等生产,受益于COVID疫情。
健帆生物:血液灌流器一家独大,由于尿毒症无法根治,患者对仪器有长时间的依赖。
乐普医疗、先健科技:研发心血管可降解支架。
大博医疗、凯利泰:骨科耗材龙头。
专科医院:

爱尔眼科:眼科连锁龙头。

欧普康视:OK镜,角膜塑形龙头,市场渗透率还不高。
通策医疗:口腔连锁龙头。同时做试管婴儿业务。
锦欣生殖:辅助生殖连锁龙头。
华熙生物、昊海生科、爱美客:医美三剑客,传统医药企业华东最近也在动作频繁。
体外诊断:
受疫情影响,体外诊断行业正迅速发展。
安图生物、迈克生物:领先的体外检测设备供应商
金域医学、迪安诊断:独立医学实验室龙头
艾德生物:聚焦肿瘤检测
万孚生物:涵盖妊娠检测、传染病检测、毒品检测等多领域。

④ 极乐投资

最后,来个沉重的话题,没有办法,也得说。

如何系统地学习股票投资?

由于这个话题太沉重了,就不展开了,大家看看就好。
重点推荐:中国平安,生死都相关,大概率被市场错杀,2022年代理人制度改革完成之后,应该会重新回到增长通道。
转自:https://mp.weixin.qq.com/s/LCZDQP1hqcgFEW22N58tDQ

监控 Python 内存使用情况和代码执行时间

我的代码的哪些部分运行时间最长、内存最多?我怎样才能找到需要改进的地方?”

在开发过程中,我很确定我们大多数人都会想知道这一点,在本文中总结了一些方法来监控 Python 代码的时间和内存使用情况。

本文将介绍4种方法,前3种方法提供时间信息,第4个方法可以获得内存使用情况。

  • time 模块
  • %%time 魔法命令
  • line_profiler
  • memory_profiler

 1. time 模块

这是计算代码运行所需时间的最简单、最直接(但需要手动开发)的方法。他的逻辑也很简单:记录代码运行之前和之后的时间,计算时间之间的差异。这可以实现如下:

 import time

 start_time = time.time()
 result = 5+2
 end_time = time.time()

 print('Time taken = {} sec'.format(end_time - start_time))

下面的例子显示了for循环和列表推导式在时间上的差异:

 import time

 # for loop vs. list comp
 list_comp_start_time = time.time()
 result = [i for i in range(0,1000000)]
 list_comp_end_time = time.time()
 print('Time taken for list comp = {} sec'.format(list_comp_end_time - list_comp_start_time))

 result=[]
 for_loop_start_time = time.time()
 for i in range(0,1000000):
     result.append(i)
 for_loop_end_time = time.time()
 print('Time taken for for-loop = {} sec'.format(for_loop_end_time - for_loop_start_time))

 list_comp_time = list_comp_end_time - list_comp_start_time
 for_loop_time = for_loop_end_time - for_loop_start_time
 print('Difference = {} %'.format((for_loop_time - list_comp_time)/list_comp_time * 100))

我们都知道for会慢一些

 Time taken for list comp = 0.05843973159790039 sec
 Time taken for for-loop = 0.06774497032165527 sec
 Difference = 15.922795107582594 %

 2. %%time 魔法命令

魔法命令是IPython内核中内置的方便命令,可以方便地执行特定的任务。一般情况下都实在jupyter notebook种使用。

在单元格的开头添加%%time ,单元格执行完成后,会输出单元格执行所花费的时间。

 %%time
 def convert_cms(cm, unit='m'):
     '''
    Function to convert cm to m or feet
    '''
     if unit == 'm':
         return cm/100
     return cm/30.48

 convert_cms(1000)

结果如下:

 CPU timesuser 24 µssys: 1 µstotal: 25 µs
 Wall time: 28.1 µs

 Out[8]: 10.0

这里的CPU times是CPU处理代码所花费的实际时间,Wall time是事件经过的真实时间,在方法入口和方法出口之间的时间。

 3. line_profiler

前两个方法只提供执行该方法所需的总时间。通过时间分析器我们可以获得函数中每一个代码的运行时间。

这里我们需要使用line_profiler包。使用pip install line_profiler。

 import line_profiler

 def convert_cms(cm, unit='m'):
     '''
    Function to convert cm to m or feet
    '''
     if unit == 'm':
         return cm/100
     return cm/30.48

 # Load the profiler
 %load_ext line_profiler

 # Use the profiler's magic to call the method
 %lprun -f convert_cms convert_cms(1000'f')

输出结果如下:

 Timer unit: 1e-06 s

 Total time: 4e-06 s
 File: /var/folders/y_/ff7_m0c146ddrr_mctd4vpkh0000gn/T/ipykernel_22452/382784489.py
 Function: convert_cms at line 1

 Line #     Hits         Time Per Hit   % Time Line Contents
 ==============================================================
      1                                           def convert_cms(cm, unit='m'):
      2                                               '''
      3                                               Function to convert cm to m or feet
      4                                               '''
      5         1         2.0     2.0     50.0     if unit == 'm':
      6                                                   return cm/100
      7         1         2.0     2.0     50.0     return cm/30.48

可以看到line_profiler提供了每行代码所花费时间的详细信息。

  • Line Contents :运行的代码
  • Hits:行被执行的次数
  • Time:所花费的总时间(即命中次数x每次命中次数)
  • Per Hit:一次执行花费的时间,也就是说 Time =  Hits X Per Hit
  • % Time:占总时间的比例

可以看到,每一行代码都详细的分析了时间,这对于我们分析时间相当的有帮助。

 4. memory_profiler

与line_profiler类似,memory_profiler提供代码的逐行内存使用情况。

要安装它需要使用pip install memory_profiler。我们这里监视convert_cms_f函数的内存使用情况

 from conversions import convert_cms_f
 import memory_profiler

 %load_ext memory_profiler

 %mprun -f convert_cms_f convert_cms_f(1000'f')

convert_cms_f函数在单独的文件中定义,然后导入。结果如下:

 Line #   Mem usage   Increment Occurrences   Line Contents
 =============================================================
      1     63.7 MiB     63.7 MiB           1   def convert_cms_f(cm, unit='m'):
      2                                             '''
      3                                             Function to convert cm to m or feet
      4                                             '''
      5     63.7 MiB     0.0 MiB           1       if unit == 'm':
      6                                                 return cm/100
      7     63.7 MiB     0.0 MiB           1       return cm/30.48memory_profiler 提供对每行代码内存使用情况的详细了解。

这里的1 MiB (MebiByte) 几乎等于 1MB。1 MiB  = 1.048576 1MB

但是memory_profiler 也有一些缺点:它通过查询操作系统内存,所以结果可能与 python 解释器略有不同,如果在会话中多次运行 %mprun,可能会注意到增量列报告所有代码行为 0.0 MiB。这是因为魔法命令的限制导致的。

虽然memory_profiler有一些问题,但是它就使我们能够清楚地了解内存使用情况,对于开发来说是一个非常好用的工具

 5. 总结一下

虽然Python并不是一个以执行效率见长的语言,但是在某些特殊情况下这些命令对我们还是非常有帮助的。

转自:https://mp.weixin.qq.com/s/oKm5oDVsXxX8UZd7FUQaFg