python – 第 7 页 – 诸事要记日拱一卒

用 Python 写一个电脑监控程序

继打游戏、看视频等摸鱼行为被监控后，现在打工人离职的倾向也会被监控。最近有网友表示，所在企业安装了行为感知系统，该系统可以提前获知员工跳槽念头。

一时间，“打工人太难了”“毫无隐私可言”的讨论层出不穷。

有些小伙伴就问了：这种监控技术上可行吗？复杂吗？今天就带大家尝试用几行 Python 代码，监控电脑上的操作。

监控键盘

如果公司偷偷在我们的电脑上运行了一个后台进程，来监控我们的键盘事件，最简单的 python 写法大致是这样的：

from pynput import keyboard

def on_press(key):
    print(f'{key} :pushed')


def on_release(key):
    if key == keyboard.Key.esc:
        return False


with keyboard.Listener(on_press=on_press, on_release=on_release) as lsn:
    lsn.join()

随意敲击键盘，你就会从控制台看到这样的输出：

用 Python 写一个电脑监控程序

代码内容就是两个方法，一个是监听按键事件，另一个是监听退出事件——敲击 ESC 按键后释放就退出了。

监控鼠标

如果还要监听鼠标事件，那么上这段代码就行了：

from pynput import mouse

def on_click(x, y, button, pressed):
    if button == mouse.Button.left:
        print('left was pressed!')
    elif button == mouse.Button.right:
        print('right was pressed!')
        return False
    else:
        print('mid was pressed!')


# 定义鼠标监听线程
with mouse.Listener(on_click=on_click) as listener:
    listener.join()

这段代码主要是监听鼠标的左右键点击操作，运行之后操作鼠标，就可以看到控制台打印如下结果：

用 Python 写一个电脑监控程序

细心的你一定会发现，每次点击事件，都打印了两次。这是因为按下和松开都会触发鼠标事件。

记录监控日志

键盘事件和鼠标事件都有了，是时候将二者结合起来，把用户的操作记录到日志了。这里我们用 loguru 这个模块来记录日志。

整个代码如下：

from pynput import keyboard, mouse
from loguru import logger
from threading import Thread

# 定义日志文件
logger.add('moyu.log')


def on_press(key):
    logger.debug(f'{key} :pushed')


def on_release(key):
    if key == keyboard.Key.esc:
        return False


# 定义键盘监听线程
def press_thread():
    with keyboard.Listener(on_press=on_press, on_release=on_release) as lsn:
        lsn.join()


def on_click(x, y, button, pressed):
    if button == mouse.Button.left:
        logger.debug('left was pressed!')
    elif button == mouse.Button.right:
        logger.debug('right was pressed!')
    else:
        return False


# 定义鼠标监听线程
def click_thread():
    with mouse.Listener(on_click=on_click) as listener:
        listener.join()


if __name__ == '__main__':
    # 起两个线程分别监控键盘和鼠标
    t1 = Thread(target=press_thread())
    t2 = Thread(target=click_thread())
    t1.start()
    t2.start()

运行之后，你就可以在同级目录下的日志文件中，看到这样的内容了：

用 Python 写一个电脑监控程序

总结

本文主要通过 pynput 这个 python 模块，演示怎么记录键盘和鼠标的操作。这几行简单的代码对于简单的输入监控是可行的，但是对于聊天记录之类的复杂语句，你还需要针对日志用 NLTK 语言处理，才能复原你的聊天记录。

当然，我们这里仅仅是从技术上讨论可行性，各位切莫做有损别人隐私的事情。再说了，仅凭这个代码，别人一眼就会发现有程序在记录操作……

获取文中相关代码，请在公众号回复关键字：监控

作者：闲欢

来源：Python 技术「ID: pythonall」

转自：https://mp.weixin.qq.com/s/_9A7hzXAXi1mBrSuDMT5EA

我做了一个App，如何让别人限时使用？

假设有这样一个场景，你接了一个私活，帮别人做一个软件，软件没有联网功能。东西做好以后，客户还没有给钱，说要先试用一下。你选择了相信客户，把软件发送给了他。然后他就把你拉黑了。

为了避免这种情况发生，你首先想到的办法，肯定是把过期时间写死到代码里面，时间到了App自动销毁。对方付钱以后，你再把这个写死的时间延长或者去掉。再重新编译后发给客户。

但问题是，每次重新编译代码并发给用户是非常麻烦的事情，有没有更简单的办法呢？能不能软件始终是一个软件，但是给用户一个注册码，这个注册码里面标记了有效时间。等到过期以后，只需要给用户一个新的注册码，就可以继续使用了。

看到这里，有同学肯定会想，怎么在注册码指定有效期呢？首先这个时间肯定不能是明文的，否则用户把它一改，岂不是就可以自行延长了。

但如果加密的话，就必须把解密算法放到软件里面，一旦用户对程序进行初步的反编译，就能拿到解密算法或者对称加密的密钥。

因此，我们只能使用非对称加密。而非对称加密里面，通过公钥加密，使用私钥解密。如果我们要让软件从注册码里面解码出有效时间，难道要在软件里面放私钥？

私钥不能泄露，因此放到软件里面的只能是公钥。但是难道能使用私钥加密，用公钥解密？

实际上，真的可以这样做，但这不叫做私钥加密公钥解密，这叫做私钥签名(sign)，公钥验证(verify)。并且，使用这个方法有一个好处，就是有效时间可以直接明文存放，不怕用户修改。因为一旦修改了，签名就匹配不上。

假设我们有一个字符串message，使用私钥，可以对这个字符串进行签名，获得一个签名字符串signature。而我们用公钥，可以验证message是否能够生成签名字符串signature。如果message发生了修改，或者signature发生了修改，或者message和signature同时发生了修改，公钥验证都会失败。

各个语言都有非对称加密相关的第三方库。我们用Python中的PyCryptodome来进行演示。

首先，我们在macOS下面，生成一对公钥和私钥：

ssh-keygen -t rsa

根据提示输入密钥的储存路径就可以了，如下图所示：

在当前文件夹，生成了私钥sign和公钥sign.pub。

接下来，使用pip安装PyCryptodome:

pip install pycryptodome

接下来，导入公钥和私钥：

>>> from Crypto.PublicKey import RSA
>>> with open('sign') as f:
...  private = f.read()
...
>>> with open('sign.pub') as f:
...  public = f.read()
...
>>> private_key = RSA.import_key(private)
>>> public_key = RSA.import_key(public)

由于我们之前生成密钥使用的是SHA256算法，因此我们需要用SHA256算法对需要签名的数据生成摘要。这一步在签名和验证签名的时候都需要做。

>>> from Crypto.Hash import SHA256
>>> digest = SHA256.new()
>>> message = 'expire: 2022-03-01'
>>> digest.update(message.encode())

接下来，对这个数据进行签名：

>>> import base64
>>> from Crypto.Signature import PKCS1_v1_5
>>> signer = PKCS1_v1_5.new(private_key)
>>> code = signer.sign(digest)
>>> signature = base64.b64encode(code)
>>> print(signature.decode())

运行效果如下图所示：

现在，你只需要把字符串expire: 2022-03-01和签名字符串xbelbTNpq8M...很长一串...发送给客户就可以了。

客户把过期时间的字符串和签名字符串输入到软件以后，软件使用公钥来验证这个字符串是不是由自己对应的私钥签名的：

>>> message = 'expire: 2022-03-01'
>>> signature = 'xbelbTNpq8MCFkSxGBoTq7SwQ+oqHRAObrj5p8K2gyY+7uWs5dXGjsQ+GP2XTS5YskCtGjYIBZmAmeM5ey69lRQyk5S1m7t68pYNbUvf3o39Ym0rcmK7XGkBh3euZzVeRErs4JCl7ffTbfcqM4aAsWldDKESrZvaDNQ5DkC8VRYHPBfZfScHqPw/zcHCMRhC9Dch8j9eQlnk8/UKY0MM92jXT4map94PzZRfMLkD4vsciZTtMJm4a42UiiWDUpA6zIgQCYru2YyKspS1uZFE51atYP5DcgPWvJUVRDJS/ZjdPfi9chRjx0dS/Df1sFEreZ7myzXAJP7Y8FA6rvi7EZLlHZ1ViM9tTJp9ut/ZlKgnPAuDCp1JSyKMUk/doVqzUjTqTNHuORe+p3Hhb+xkCASyD8eUH+CyEDVLRcDkSMH5U3o/uONnOQao2o9dbkGiSYNkToElQJ2v20S3MnncPciij8H7iI2dDp1dwt8bkcZOD+E1Tf88LMvRaxB7YnhJ'
>>> digest = SHA256.new()
>>> digest.update(message.encode())
>>> reader = PKCS1_v1_5.new(public_key)
>>> reader.verify(digest, base64.b64decode(signature.encode()))
True

但如果你篡改了message的内容，那么验证就会失败，如下图所示：

软件第一次验证通过以后，就可以把这个过期时间的字符串和签名字符串一起用文件的形式存到硬盘上，每次启动软件的时候都检查一遍。发现合法并且没有过期就正常运行。发现过期了或者不合法就就重新弹出输入注册码的对话框。

转自：https://mp.weixin.qq.com/s/LvXhTj_3OLqK-7kinV9UZg

一行 Python 代码去除照片背景

今天来教大家如何使用Python去除照片背景，说到去除照片背景的方法，我们首先想到的是第三方接口（如：百度AI），但本文重点在于免费使用，不花钱的那种。

下面就开始介绍两种免费去除照片背景的方法

第一种

第一种方法是：removebg（实际上还是第三方接口，不过removebg是免费的）

一行 Python 代码去除照片背景

remove官方地址：

https://www.remove.bg/

首先先注册一个账号，然后访问下方链接获取api_keys(代码里面会用到)

https://www.remove.bg/api#remove-background

一行 Python 代码去除照片背景

点击Get API Key 即可获取key值

一行 Python 代码去除照片背景

获取到key值后，咱们就开编写python程序

# 导入库
from removebg import RemoveBg
api_keys = "上面获取到的key值"
rmbg = RemoveBg(api_key, "error.log")
#rmbg.remove_background_from_img_file("图片路径")
rmbg.remove_background_from_img_file("chen.jpg")

样例效果：

一行 Python 代码去除照片背景

（图片来源网络）

总结

优点：不限于证件照，任何图片都可以去除背景（包括全身照片以及多人合影照片等）

缺点：这个方法只能免费使用50次，超过50次就会提示报错（如下所示）

一行 Python 代码去除照片背景

第二种

第二种方法就是backgroundremover，其实就是一个Python库

github地址：

https://github.com/nadermx/backgroundremover

使用很简单：就两步（github介绍安装中有一些没必要安装，可忽略）

第一步：安装库

pip install backgroundremover

第二步：执行命令

# backgroundremover -i "带背景照片" -o "去除背景照片"
backgroundremover -i "cg.jpg" -o "cg_outopt.jpg"

Python方式调用：

# 导入库
import os
os.system('backgroundremover -i "cg.jpg" -o "cg_output.jpg"')

原理：实际上就是python通过os去执行终端命令。

注意：

在第二步时，初次使用需要下载模型（大概170m），下载地址是google，因此需要能够访问google，才能下载。

我们已经把模型下载好了，关注 Python开发者公号，后台回复 u2net 即可获取。

一行 Python 代码去除照片背景

（模型文件名称）

下载好的模型需要放到当前系统用户的目录下：

## Window：
c:/Windows/user/.u2net/u2net.pth

## Mac:
/Users/lyc/.u2net/u2net.pth

## Linux:
/root/.u2net/u2net.pth

如果找不到这个位置的，直接搜索.u2net文件夹位置，将模型放到.u2net文件夹也可以

样例效果：

一行 Python 代码去除照片背景

（图片来源网络）

同一张照片，使用这两种不同的方法去除背景

效果差别不大（推荐第二种方法）

总结

优点：不限次数使用，不仅可以对照片去除背景，还可以对视频去除背景（github上有使用方法，感兴趣的可以去看看）

总结

对比这两种方法，推荐使用第二种，理由：完全免费、功能多。

– EOF –

转自：https://mp.weixin.qq.com/s/nTTDN9NhYYlwlb9gKKSqXQ

近年来，随着技术的发展，机器学习和深度学习在金融资产量化研究上的应用越来越广泛和深入。目前，大量数据科学家在Kaggle网站上发布了使用机器学习/深度学习模型对股票、期货、比特币等金融资产做预测和分析的文章。从金融投资的角度看，这些文章可能缺乏一定的理论基础支撑（或交易思维），大都是基于数据挖掘。但从量化的角度看，有很多值得我们学习参考的地方，尤其是Pyhton的深入应用、数据可视化和机器学习模型的评估与优化等。下面借鉴Kaggle上的一篇文章《Building an Asset Trading Strategy》，以上证指数为例，构建双均线交易策略，以交易信号为目标变量，以技术分析指标作为预测特征变量，使用多种机器学习模型进行对比评估和优化。文中的特征变量构建和提取，机器学习模型的对比评估和结果可视化都是很好的参考模板。

数据获取与指标构建

先引入需要用到的libraries，这是Python语言的突出特点之一。这些涉及到的包比较多，包括常用的numpy、pandas、matplotlib，技术分析talib，机器学习sklearn和数据包tushare等。

#先引入后面可能用到的libraries
import numpy as np
import pandas as pd  
import tushare as ts
#技术指标
import talib as ta
#机器学习模块
from sklearn.linear_model import LogisticRegression
from sklearn.discriminant_analysis import LinearDiscriminantAnalysis
from sklearn.neighbors import KNeighborsClassifier
from sklearn.tree import DecisionTreeClassifier
from sklearn.naive_bayes import GaussianNB
from sklearn.ensemble import GradientBoostingClassifier
from xgboost import XGBClassifier,XGBRegressor
from catboost import CatBoostClassifier,CatBoostRegressor
from sklearn.ensemble import RandomForestClassifier,RandomForestRegressor
from sklearn.model_selection import train_test_split,KFold,cross_val_score
from sklearn.metrics import accuracy_score
import shap
from sklearn.feature_selection import SelectKBest,f_regression
from sklearn import preprocessing
#画图
import seaborn as sns
import matplotlib.pyplot as plt
import plotly.graph_objects as go
import plotly.express as px

%matplotlib inline   
#正常显示画图时出现的中文和负号
from pylab import mpl
mpl.rcParams['font.sans-serif']=['SimHei']
mpl.rcParams['axes.unicode_minus']=False

数据获取

用tushare获取上证行情数据作为分析样本。

#默认以上证指数交易数据为例
def get_data(code='sh',start='2000-01-01',end='2021-03-02'):
    df=ts.get_k_data('sh',start='2005')
    df.index=pd.to_datetime(df.date)
    df=df[['open','high','low','close','volume']]
    return df

df=get_data()
df_train,df_test=df.loc[:'2017'],df.loc['2018':]

构建目标变量（target variable）

以交易信号作为目标变量，使用价格信息和技术指标作为特征变量进行预测分析。以双均线交易策略为例，当短期均线向上突破长期均线时形成买入信号（设定为1），当短期均线向下跌破长期均线时发出卖出信号（设定为0），然后再使用机器学习模型进行预测和评估。这里将短期移动平均值(SMA1)和长期移动平均值(SMA2)的参数分别设置为10和60，二者的设定具有一定的任意性，参数的选择会影响后续结果，所以理想情况下需要进行参数优化来找到最优值。

def trade_signal(data,short=10,long=60,tr_id=False):
    data['SMA1'] = data.close.rolling(short).mean()
    data['SMA2'] = data.close.rolling(long).mean() 
    data['signal'] = np.where(data['SMA1'] >data['SMA2'], 1.0, 0.0) 
    if(tr_id is not True):
        display(data['signal'].value_counts())

df_tr1 = df_train.copy(deep=True)  
df_te1 = df_test.copy(deep=True) 
trade_signal(df_tr1)  #
trade_signal(df_te1,tr_id=True)

plt.figure(figsize=(14,12), dpi=80)
ax1 = plt.subplot(211)
plt.plot(df_tr1.close,color='b')
plt.title('上证指数走势',size=15)
plt.xlabel('')
ax2 = plt.subplot(212)
plt.plot(df_tr1.signal,color='r')
plt.title('交易信号',size=15)
plt.xlabel('')
plt.show()

df_tr1[['SMA1','SMA2','signal']].iloc[-250:].plot(figsize=(14,6),secondary_y=['signal'])
plt.show()

#删除均线变量
df_tr1=df_tr1.drop(['SMA1','SMA2'], axis=1)
df_te1=df_te1.drop(['SMA1','SMA2'], axis=1)

#画目标变量与其他变量之间的相关系数图
cmap = sns.diverging_palette(220, 10, as_cmap=True)
def corrMat(df,target='demand',figsize=(9,0.5),ret_id=False):

    corr_mat = df.corr().round(2);shape = corr_mat.shape[0]
    corr_mat = corr_mat.transpose()
    corr = corr_mat.loc[:, df.columns == target].transpose().copy()

    if(ret_id is False):
        f, ax = plt.subplots(figsize=figsize)
        sns.heatmap(corr,vmin=-0.3,vmax=0.3,center=0, 
                     cmap=cmap,square=False,lw=2,annot=True,cbar=False)
        plt.title(f'Feature Correlation to {target}')

    if(ret_id):
        return corr

corrMat(df_tr1,'signal',figsize=(7,0.5))

Python+机器学习寻找股票交易信号

当前的特征open、high、low、close、volumes与目标变量的线性相关值非常小，这可能意味着存在高非线性，相对平稳值的稳定振荡(圆形散射)，或者也许它们不是理想的预测特征变量，所以下面需要进行特征构建和选取。

技术指标特征构建

为方便分析，下面以常见的几个技术指标作为特征引入特征矩阵，具体指标有：

移动平均线:移动平均线通过减少噪音来指示价格的运动趋势。
随机振荡器%K和%D:随机振荡器是一个动量指示器，比较特定的证券收盘价和一定时期内的价格范围。%K、%D分别为慢、快指标。
相对强弱指数(RSI):动量指标，衡量最近价格变化的幅度，以评估股票或其他资产的价格超买或超卖情况。
变化率(ROC):动量振荡器，测量当前价格和n期过去价格之间的百分比变化。ROC值越高越有可能超买，越低可能超卖。
动量(MOM):证券价格或成交量加速的速度;价格变化的速度。

#复制之前的数据
df_tr2=df_tr1.copy(deep=True)
df_te2=df_te1.copy(deep=True)

计算技术指标

#使用talib模块直接计算相关技术指标
#下面参数的选取具有主观性
def indicators(data):
    data['MA13']=ta.MA(data.close,timeperiod=13)
    data['MA34']=ta.MA(data.close,timeperiod=34)
    data['MA89']=ta.MA(data.close,timeperiod=89)
    data['EMA10']=ta.EMA(data.close,timeperiod=10)
    data['EMA30']=ta.EMA(data.close,timeperiod=30)
    data['EMA200']=ta.EMA(data.close,timeperiod=200)
    data['MOM10']=ta.MOM(data.close,timeperiod=10)
    data['MOM30']=ta.MOM(data.close,timeperiod=30)
    data['RSI10']=ta.RSI(data.close,timeperiod=10)
    data['RSI30']=ta.RSI(data.close,timeperiod=30)
    data['RS200']=ta.RSI(data.close,timeperiod=200)
    data['K10'],data['D10']=ta.STOCH(data.high,data.low,data.close, fastk_period=10)
    data['K30'],data['D30']=ta.STOCH(data.high,data.low,data.close, fastk_period=30)
    data['K20'],data['D200']=ta.STOCH(data.high,data.low,data.close, fastk_period=200)

indicators(df_tr2)
indicators(df_te2)

corrMat(df_tr2,'signal',figsize=(15,0.5))

Python+机器学习寻找股票交易信号

上图可以看到明显线性相关的一组特征是作为特征工程的结果创建的。如果在特征矩阵中使用基本数据集特征，很可能对目标变量的变化影响很小或没有影响。另一方面，新创建的特征具有相当宽的相关值范围，这是相当重要的;与目标变量（交易信号）的相关性不算特别高。

#删除缺失值
df_tr2 = df_tr2.dropna() 
df_te2 = df_te2.dropna()

模型预测与评估

下面使用常用的机器学习算法分别对数据进行拟合和交叉验证评估。

models.append(('RF', RandomForestClassifier(n_estimators=25)))

models = []
#轻量级模型 
#线性监督模型
models.append(('LR', LogisticRegression(n_jobs=-1)))
models.append(('TREE', DecisionTreeClassifier())) 
#非监督模型
models.append(('LDA', LinearDiscriminantAnalysis())) 
models.append(('KNN', KNeighborsClassifier())) 
models.append(('NB', GaussianNB())) 
#高级模型
models.append(('GBM', GradientBoostingClassifier(n_estimators=25)))
models.append(('XGB',XGBClassifier(n_estimators=25,use_label_encoder=False)))
models.append(('CAT',CatBoostClassifier(silent=True,n_estimators=25)))

构建模型评估函数

def modelEval(ldf,feature='signal',split_id=[None,None],eval_id=[True,True,True,True],
              n_fold=5,scoring='accuracy',cv_yrange=None,hm_vvals=[0.5,1.0,0.75]):

    ''' Split Train/Evaluation <DataFrame> Set Split '''

    # split_id : Train/Test split [%,timestamp], whichever is not None
    # test_id : Evaluate trained model on test set only

    if(split_id[0] is not None):
        train_df,eval_df = train_test_split(ldf,test_size=split_id[0],shuffle=False)
    elif(split_id[1] is not None):
        train_df = df.loc[:split_id[1]]; eval_df = df.loc[split_id[1]:] 
    else:
        print('Choose One Splitting Method Only')

    ''' Train/Test Feature Matrices + Target Variables Split'''
    y_train = train_df[feature]
    X_train = train_df.loc[:, train_df.columns != feature]
    y_eval = eval_df[feature]
    X_eval = eval_df.loc[:, eval_df.columns != feature]
    X_one = pd.concat([X_train,X_eval],axis=0)
    y_one = pd.concat([y_train,y_eval],axis=0)

    ''' Cross Validation, Training/Evaluation, one evaluation'''
    lst_res = []; names = []; lst_train = []; lst_eval = []; lst_one = []; lst_res_mean = []
    if(any(eval_id)):
        for name, model in models:  
            names.append(name)

            # Cross Validation Model on Training Se
            if(eval_id[0]):
                kfold = KFold(n_splits=n_fold, shuffle=True)
                cv_res = cross_val_score(model,X_train,y_train, cv=kfold, scoring=scoring)
                lst_res.append(cv_res)

            # Evaluate Fit Model on Training Data
            if(eval_id[1]):
                res = model.fit(X_train,y_train)
                train_res = accuracy_score(res.predict(X_train),y_train); lst_train.append(train_res)
            if(eval_id[2]):
                if(eval_id[1] is False):  # If training hasn't been called yet
                    res = model.fit(X_train,y_train)
                eval_res = accuracy_score(res.predict(X_eval),y_eval); lst_eval.append(eval_res)

            # Evaluate model on entire dataset
            if(eval_id[3]):
                res = model.fit(X_one,y_one)
                one_res = accuracy_score(res.predict(X_one),y_one); lst_one.append(one_res)

            ''' [out] Verbal Outputs '''
            lst_res_mean.append(cv_res.mean())
            fn1 = cv_res.mean()
            fn2 = cv_res.std();
            fn3 = train_res
            fn4 = eval_res
            fn5 = one_res

    s0 = pd.Series(np.array(lst_res_mean),index=names)
    s1 = pd.Series(np.array(lst_train),index=names)
    s2 = pd.Series(np.array(lst_eval),index=names)
    s3 = pd.Series(np.array(lst_one),index=names)
    pdf = pd.concat([s0,s1,s2,s3],axis=1)
    pdf.columns = ['cv_average','train','test','all']

    ''' Visual Ouputs '''
    sns.set(style="whitegrid")
    fig,ax = plt.subplots(1,2,figsize=(15,4))
    ax[0].set_title(f'{n_fold} Cross Validation Results')
    sns.boxplot(data=lst_res, ax=ax[0], orient="v",width=0.3)
    ax[0].set_xticklabels(names)
    sns.stripplot(data=lst_res,ax=ax[0], orient='v',color=".3",linewidth=1)
    ax[0].set_xticklabels(names)
    ax[0].xaxis.grid(True)
    ax[0].set(xlabel="")
    if(cv_yrange is not None):
        ax[0].set_ylim(cv_yrange)
    sns.despine(trim=True, left=True)
    sns.heatmap(pdf,vmin=hm_vvals[0],vmax=hm_vvals[1],center=hm_vvals[2],
            ax=ax[1],square=False,lw=2,annot=True,fmt='.3f',cmap='Blues')
    ax[1].set_title('Accuracy Scores')
    plt.show()

基准模型：使用原始行情数据作为特征

modelEval(df_tr1,split_id=[0.2,None])

结果显示，cross_val_score徘徊在准确度= 0.5的区域，这表明仅使用指数/股票的价格数据（开盘、最高、最低、成交量、收盘）很难准确预测价格变动的方向性。大多数模型的训练得分往往高于交叉验证得分。有意思的是，DecisionTreeClassifier & RandomForest即使很少估计可以达到非常高的分数，但交叉验证的得分却很低，表明对训练数据可能存在过度拟合了。

加入技术指标特征

modelEval(df_tr2,split_id=[0.2,None],cv_yrange=(0.8,1.0),hm_vvals=[0.8,1.0,0.9])

Python+机器学习寻找股票交易信号

结果表明，与基准模型相比，准确率得分有了非常显著的提高。线性判别分析(LDA)的表现非常出色，不仅在训练集上，而且在交叉验证中，得分显著提高。毫无疑问，更复杂的模型GBM,XGB,CAT,RF在全样本中评估得分较高。与有监督学习模型相比，kNN和GaussianNB的无监督模型表现较差。

特征的优化

def feature_importance(ldf,feature='signal',n_est=100):
    # Input dataframe containing feature & target variable
    X = ldf.copy()
    y = ldf[feature].copy()
    del X[feature]
    # CORRELATION
    imp = corrMat(ldf,feature,figsize=(15,0.5),ret_id=True)
    del imp[feature]
    s1 = imp.squeeze(axis=0);s1 = abs(s1)
    s1.name = 'Correlation'      
    # SHAP
    model = CatBoostRegressor(silent=True,n_estimators=n_est).fit(X,y)
    explainer = shap.TreeExplainer(model)
    shap_values = explainer.shap_values(X)
    shap_sum = np.abs(shap_values).mean(axis=0)
    s2 = pd.Series(shap_sum,index=X.columns,name='Cat_SHAP').T
    #  RANDOMFOREST
    model = RandomForestRegressor(n_est,random_state=0, n_jobs=-1)
    fit = model.fit(X,y)
    rf_fi = pd.DataFrame(model.feature_importances_,index=X.columns,                                  
            columns=['RandForest']).sort_values('RandForest',ascending=False)
    s3 = rf_fi.T.squeeze(axis=0)
    # XGB 
    model=XGBRegressor(n_estimators=n_est,learning_rate=0.5,verbosity = 0)
    model.fit(X,y)
    data = model.feature_importances_
    s4 = pd.Series(data,index=X.columns,name='XGB').T
    # KBEST
    model = SelectKBest(k=5, score_func=f_regression)
    fit = model.fit(X,y)
    data = fit.scores_
    s5 = pd.Series(data,index=X.columns,name='K_best')
    # Combine Scores
    df0 = pd.concat([s1,s2,s3,s4,s5],axis=1)
    df0.rename(columns={'target':'lin corr'})
    x = df0.values 
    min_max_scaler = preprocessing.MinMaxScaler()
    x_scaled = min_max_scaler.fit_transform(x)
    df = pd.DataFrame(x_scaled,index=df0.index,columns=df0.columns)
    df = df.rename_axis('Feature Importance via', axis=1)
    df = df.rename_axis('Feature', axis=0)
    pd.options.plotting.backend = "plotly"
    fig = df.plot(kind='bar',title='Scaled Feature Importance')
    fig.show()

feature_importance(df_tr2)

注意到，对于很多特征，相关性(Pearson’s value)小的在其他方法中也会给出小的得分值。同样，高相关的特征在其他特征重要性方法中得分也很高。当谈到特征的重要性时，有一些特征显示出一些轻微的不一致，总的来说，大多数方法都可以观察到特征评分的相似性。在机器学习中，某些特征对于大多数方法来说都有一个非常低的相对分数值，因此可能没有什么影响，即使把它们删除，也不会降低模型的准确性。删除可能不受影响的特性将使整个方法更加有效，同时可以专注于更长和更深入的超参数网格搜索，可能得到比原来模型更准确的结果。

df_tr2_FI = df_tr2.drop(columns=['open','high','low','close','EMA10'])

modelEval(df_tr2_FI,split_id=[0.2,None],cv_yrange=(0.8,1.0),hm_vvals=[0.8,1.0,0.9])

Python+机器学习寻找股票交易信号

结果显示，删掉预测能力较弱的特征后，某些机器学习方法的预测得分提高了，如线性判别（LDA）、决策树（TREE）和随机森林（RF）等。

结语

本文只是以上证指数为例，以技术指标作为特征，使用机器学习算法对股票交易信号（注意这里不是股价或收益率）进行预测评估，目的在于向读者展示Python机器学习在金融量化研究上的应用。从金融维度来看，分析的深度较浅，实际上对股价预测有用的特征有很多，包括（1）外在因素，如股票相关公司的竞争对手、客户、全球经济、地缘政治形势、财政和货币政策、资本获取等。因此，公司股价可能不仅与其他公司的股价相关，还与大宗商品、外汇、广义指数、甚至固定收益证券等其他资产相关；（2）股价市场因素，如很多投资者关注技术指标。（3）公司基本面因素，如公司的年度和季度报告可以用来提取或确定关键指标，如净资产收益率(ROE)和市盈率(price -to – earnings)。此外，新闻可以预示即将发生的事件，这些事件可能会推动股价向某个方向发展。当关注股票价格预测时，我们可以使用类似的方法来构建影响预测变量的因素，希望本文能起到抛砖引玉的作用。

资料来源：

Andrey Shtrauss. ‘Building an Asset Trading Strategy‘, 2020.

https://www.kaggle.com/shtrausslearning/building-an-asset-trading-strategy

感谢转发和点赞的各位~

作者：CuteHand

来源：Python金融量化

转自：https://mp.weixin.qq.com/s/7NP0AAYi4F-v-OQlFQSNtA

Django实战: 手把手教你配置Django SimpleUI打造美丽后台(多图)

很多人对Django自带的管理后台admin是又爱又恨，优点是几行代码配置就可以撸出一个功能性强的管理后台，缺点就是不怎么美观，感觉拿不出手。在所有的Django后台美化插件中，SimpleUI处于第一阵营，非常符合国人的审美观。本文将手把手教你如何配置使用Simple UI, 包括自定义菜单和控制面板等高级使用技巧.

安装

第一步 pip安装并加入INSTALLED_APPS

 pip install django-simpleui

修改settings.py, 将simpleui加入到INSTALLED_APPS里去，放在第一行，也就是django自带admin的前面。

 INSTALLED_APPS = [
       'simpleui', # 注意这里
       'django.contrib.admin',
       'django.contrib.auth',
       'django.contrib.contenttypes',
       'django.contrib.sessions',
       'django.contrib.messages',
       'django.contrib.staticfiles',
       ...     
 ]

第二步测试是否安装成功

使用python manage.py runserver命令启动本地测试服务器, 访问/admin/, 如果你能看到如下页面说明安装成功。

Django实战: 手把手教你配置Django SimpleUI打造美丽后台(多图)

登录后你还将看到如下用户界面：

Django实战: 手把手教你配置Django SimpleUI打造美丽后台(多图)

注意：如果你在生成环境中使用SimpleUI，还需要使用python manage.py collectstatic命令收集静态文件，否则样式无法正常显示。

常用配置

设置语言, 去Logo和管理后台名字

当你看到以上界面时，首先你想改动的一定是语言，去掉SimpleUI的默认logo，并把Django administration改成比如某某管理后台的名字。

修改settings.py，添加如下代码：

 # 更改默认语言为中文
 LANGUAGE_CODE = 'zh-hans'
 
 # 去掉默认Logo或换成自己Logo链接
 SIMPLEUI_LOGO = 'https://th.bing.com/th/id/R2411a2b340731d67dfa0d84503e915e3?rik=zmYce%2fLys72JVQ&pid=ImgRaw'

修改管理后台的名称和标题要稍微复杂些，因为你不能直接在settings.py里进行配置。在任何一个app的目录下新建一个admin.py, 添加如下代码即可修改(本例app名为tasks)。这个设置属于Django的设置，不属于SimpleUI的设置。

 # tasks/admin.py
 from django.contrib import admin
 
 admin.site.site_header = '大江狗管理后台'  # 设置header
 admin.site.site_title = '大江狗管理后台'   # 设置title
 admin.site.index_title = '大江狗管理后台'
 
 from .models import Task
 admin.site.register(Task)

登录后的效果如下所示：

Django实战: 手把手教你配置Django SimpleUI打造美丽后台(多图)

现在你可以看到语言、logo和管理后台名字都已经改过来了。但是你会发现两个问题，左侧菜单的tasks显示的依然是英文，我们需要将其设置成中文。另外，右侧有simpleui的广告链接，页面背后有js文件跟踪simpleui的使用，这些都需要关闭。我们接下来教你如何解决这两个问题。

自定义或第三方APP名和模型名修改成中文

修改tasks/app.py, 通过verbose_name可以将app名改为中文，这里将tasks 改成了任务管理。

 from django.apps import AppConfig
 
 class TasksConfig(AppConfig):
     name = 'tasks'
 
     verbose_name = '任务管理'

接着修改tasks/models.py, 以中文设置模型的verbose_name, 如下所示：

 from django.db import models
 
 class Status(models.TextChoices):
     UNSTARTED = 'u', "Not started yet"
     ONGOING = 'o', "Ongoing"
     FINISHED = 'f', "Finished"
 
 
 class Task(models.Model):
     name = models.CharField(verbose_name="Task name", max_length=65, unique=True)
     status = models.CharField(verbose_name="Task status", max_length=1, choices=Status.choices)
     
     class Meta:
         verbose_name = "任务"
         verbose_name_plural = "任务"
 
     def __str__(self):
         return self.name

现在刷新页面，你将看到tasks英文都变成中文了。

Django实战: 手把手教你配置Django SimpleUI打造美丽后台(多图)

实际Django开发中，我们还会用到第三方应用app和第三方app提供的模型，我们也可以通过打补丁的方式更改第三方app或模型以及模型字段的verbose_name或者label，将其修改成中文，如下所示：

 from third_package.models import ModelA
 
 ModelA._meta.verbose_name = ''
 ModelA._meta.verbose_name_plural = ''
 ModelA._meta.get_field('first_name').verbose_name = '名字'

关闭右侧广告链接和使用分析

修改settings.py, 添加如下两行代码：

 # 隐藏右侧SimpleUI广告链接和使用分析
 SIMPLEUI_HOME_INFO = False 
 SIMPLEUI_ANALYSIS = False

现在查看效果，是不是清爽多了?

Django实战: 手把手教你配置Django SimpleUI打造美丽后台(多图)

实际上首页的快捷操作和最近动作也可以关闭，在自定义首页部分我们会讲到。

设置默认主题

SimpleUI默认主题(default)是深蓝色的，它支持的主题有Element-ui, Admin Lte和Layui等多种风格。你可以通过右上角下拉菜单改变主题，也可以在settings.py中设置默认主题，如下所示：

 # 设置默认主题，指向主题css文件名。Admin Lte风格
 SIMPLEUI_DEFAULT_THEME = 'admin.lte.css'
 
 # 设置默认主题，指向主题css文件名。Element-ui风格
 SIMPLEUI_DEFAULT_THEME = 'element.css'
 
 # 设置默认主题，指向主题css文件名。layui风格
 SIMPLEUI_DEFAULT_THEME = 'layui.css'
 
 # 设置默认主题，指向主题css文件名。紫色风格
 SIMPLEUI_DEFAULT_THEME = 'purple.css'

自定义菜单

左侧可折叠菜单是Simple UI系统默认菜单，根据已注册的应用和模型自动生成，其中父级菜单是App名，子菜单一般是所属App的各个模型名。SimpleUI甚至会自动为你分配默认图标，比如本例的tasks的应用使用了font-awsome的fa fa-tasks。在大多数情况下，Simple UI系统默认菜单不能满足需求，这时你就需要自定义菜单了，比如添加新的选项或给菜单选项分配新的图标。

修改settings.py, 添加如下代码：

 SIMPLEUI_CONFIG = {
      # 是否使用系统默认菜单，自定义菜单时建议关闭。
     'system_keep': False,
     
      # 用于菜单排序和过滤, 不填此字段为默认排序和全部显示。空列表[] 为全部不显示.
     'menu_display': ['任务管理', '权限认证'],
     
     # 设置是否开启动态菜单, 默认为False. 如果开启, 则会在每次用户登陆时刷新展示菜单内容。
     # 一般建议关闭。
     'dynamic': False,
     'menus': [
         {
             'app': 'auth',
             'name': '权限认证',
             'icon': 'fas fa-user-shield',
             'models': [
                 {
                 'name': '用户列表',
                 'icon': 'fa fa-user',
                 'url': 'auth/user/'
                 },
                 {
                     'name': '用户组',
                     'icon': 'fa fa-th-list',
                     'url': 'auth/group/'
                 }
             ]
         },
 
         {
             'name': '任务管理',
             'icon': 'fa fa-th-list',
             'models': [
                 {
                 'name': '任务列表',
                 # 注意url按'/admin/应用名小写/模型名小写/'命名。 
                 'url': '/admin/tasks/task/',
                 'icon': 'fa fa-tasks'
                 },
             ]
         },
     ]
 }

自定义菜单效果如下所示。我们更改了SimpleUI默认分配的图标。你还可以随意增减菜单选项并对其进行排序:

Django实战: 手把手教你配置Django SimpleUI打造美丽后台(多图)

自定义首页

SimpleUI默认首页由快捷链接和最近动作组成，我们可以将其隐藏，并将其链接到其它url。

继续修改settings.py, 添加如下代码：

 # 隐藏首页的快捷操作和最近动作
 SIMPLEUI_HOME_QUICK = False 
 SIMPLEUI_HOME_ACTION = False
 
 # 修改左侧菜单首页设置
 SIMPLEUI_HOME_PAGE = 'https://www.baidu.com'  # 指向页面
 SIMPLEUI_HOME_TITLE = '百度欢迎你!' # 首页标题
 SIMPLEUI_HOME_ICON = 'fa fa-code' # 首页图标
 
 # 设置右上角Home图标跳转链接，会以另外一个窗口打开
 SIMPLEUI_INDEX = 'https://www.baidu.com'

展示效果将如下所示：

Django实战: 手把手教你配置Django SimpleUI打造美丽后台(多图)

实际应用中后台首页通常是控制面板，需要用图表形式展示各种关键数据，这时就需要重写首页了。这里主要有两种实现方法。第一种是重写simpleui自带的home.html, 另一种自己编写一个控制面板的页面，然后设置首页指向它, 个人倾向于第二种, 因为它完全不涉及改动simpleui的源码。

我们现在开始使用Django编写一个用于显示控制面板的页面，用于在首页显示注册用户数量及任务数量。URL路由及对应的视图函数如下所示：

 # tasks/urls.py
 urlpatterns = [
     path('tasks/dashboard/', views.dashboard, name='dashboard'),
 ]
 
 # tasks/views.py
 from django.contrib.auth.models import User
 from django.shortcuts import render
 from .models import Task
 
 def dashboard(request):
     user_count = User.objects.count()
     task_count = Task.objects.count()
 
     context = { 'user_count': user_count, 'task_count': task_count }
     return render(request, 'tasks/dashboard.html',context)

我们的模板也很简单，使用了boostrap4的admin lte风格的卡片展示用户总数和任务总数。

 <!DOCTYPE html>
 <html>
 <head>
   <meta charset="utf-8">
   <meta http-equiv="X-UA-Compatible" content="IE=edge">
   <title>控制面板</title>
   <!-- Tell the browser to be responsive to screen width -->
   <meta name="viewport" content="width=device-width, initial-scale=1">
   <!-- Theme style -->
     <link rel="stylesheet" href="https://adminlte.io/themes/AdminLTE/bower_components/bootstrap/dist/css/bootstrap.min.css">
   <link rel="stylesheet" href="https://adminlte.io/themes/AdminLTE/dist/css/AdminLTE.min.css">
 
 </head>
 <body>
 <div class="wrapper">
  <!-- Main content -->
     <section class="content">
       <div class="container-fluid">
         <!-- Small boxes (Stat box) -->
         <div class="row">
           <div class="col-sm-3">
             <!-- small box -->
             <div class="small-box bg-info">
               <div class="inner">
                 <h3>{{ user_count }}</h3>
 
                 <p>用户总数</p>
               </div>
               <div class="icon">
                 <i class="ion ion-bag"></i>
               </div>
               <a href="#" class="small-box-footer">更多信息 <i class="fas fa-arrow-circle-right"></i></a>
             </div>
           </div>
           <!-- ./col -->
           <div class="col-sm-3">
             <!-- small box -->
             <div class="small-box bg-success">
               <div class="inner">
                 <h3>{{ task_count }}</h3>
                 <p>任务总数</p>
               </div>
               <div class="icon">
                 <i class="ion ion-stats-bars"></i>
               </div>
               <a href="#" class="small-box-footer">更多信息 <i class="fas fa-arrow-circle-right"></i></a>
             </div>
           </div>
           <!-- ./col -->
              <div class="col-sm-3">
             <!-- small box -->
             <div class="small-box bg-info">
               <div class="inner">
                 <h3>{{ user_count }}</h3>
 
                 <p>用户总数</p>
               </div>
               <div class="icon">
                 <i class="ion ion-bag"></i>
               </div>
               <a href="#" class="small-box-footer">更多信息 <i class="fas fa-arrow-circle-right"></i></a>
             </div>
           </div>
           <!-- ./col -->
           <div class="col-sm-3">
             <!-- small box -->
             <div class="small-box bg-success">
               <div class="inner">
                 <h3>{{ task_count }}</h3>
 
                 <p>任务总数</p>
               </div>
               <div class="icon">
                 <i class="ion ion-stats-bars"></i>
               </div>
               <a href="#" class="small-box-footer">更多信息 <i class="fas fa-arrow-circle-right"></i></a>
             </div>
           </div>
           <!-- ./col -->
         </div>
       </div>
     </section>
   </div>
 </body>

现在修改我们的settings.py, 将首页指向这个新创建的控制面板。

 # 修改首页设置, 指向新创建的控制面板
 SIMPLEUI_HOME_PAGE = '/tasks/dashboard/'
 SIMPLEUI_HOME_TITLE = '控制面板!' 
 SIMPLEUI_HOME_ICON = 'fa fa-eye'

刷新浏览器，你就会发现我们的首页已经修改了，是不是很酷?

Django实战: 手把手教你配置Django SimpleUI打造美丽后台(多图)

Django SimpleUI, 你学会了吗? 体验完了SimpleUI, 我会用三个词语来描述它, 国人口味, 果然很美, 确实简单! 老规矩, 看懂了听懂了的留言点赞啊!

大江狗

转自：https://mp.weixin.qq.com/s/_HKXaea1entAf9guNRsv4A

监控键盘

监控鼠标

记录监控日志

总结

数据获取

构建目标变量（target variable）

技术指标特征构建

计算技术指标

基准模型：使用原始行情数据作为特征

加入技术指标特征

特征的优化

Andrey Shtrauss. ‘Building an Asset Trading Strategy‘, 2020.

安装

第一步 pip安装并加入INSTALLED_APPS

第二步 测试是否安装成功

常用配置

设置语言, 去Logo和管理后台名字

自定义或第三方APP名和模型名修改成中文

关闭右侧广告链接和使用分析

设置默认主题

自定义菜单

自定义首页

第二步测试是否安装成功