0%

交叉验证(cross-validation)是一种评估泛化性能(新数据能否正确预测)的统计学方法,它比单次划分训练集和测试集的方法更加稳定、全面。如果只划分一次训练集和测试集,可能难以分类的样本都在测试集中,那么精度会低的离谱,相反,如果容易分类的样本都在测试集中,精度则会高的离谱,所以会导致模型并不能反映数据的真实情况。

Read more »

独热编码(one-hot encoding) 独热编码是通过创建一个新的虚拟特征,虚拟特征的每一列各代表标称数据的一个值。例如,颜色一共有四个取值green、blue、red、black,独热编码是通过四位二进制来表示,如果是green就表示为[1,0,0,0],对应的颜色是[green,blue,red,black],如果属于哪一种颜色,则取值为1,否则为0。

Read more »

看着手机上卡卡罗特的图片,心理有一股浅浅莫名的伤感。龙珠都看完了吗?没有,严格意义上来说,其实自己看的并不多,回忆起来也只有卡卡罗特和贝吉塔争强好胜,想赢过对方,各自狠狠努力以及超级赛亚人变身的场景,但是音乐,配色,人物的特点,整体的感觉真的很棒!对于很多人来说,这是一场异常美丽的梦,而他的去世就像宣告梦醒时刻的到来,我入梦并不深,都有一种莫名的伤感,何况那些早就一头扎下去的人们。死亡总是向人们宣告人生的一切就是一场幻梦,不管这个梦有多么的美好,早晚都有梦醒时分,如果一切都是一场终将醒来的梦,人要怎么活呢?唯一的答案就是去造属于自己的“春秋大梦”,大胆一些,勇敢一些,在自己的龙珠里,做自己,那个永不言败强大万分的卡卡罗特,一切终将逝去。

Read more »

复现这篇文章基于随机森林方法的缺失值填充

导入各自包:

1
2
3
4
5
6
7
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
# from sklearn.datasets import load_boston # 新版本无波士顿数据
from sklearn.impute import SimpleImputer # 填充缺失值的类
from sklearn.ensemble import RandomForestRegressor # 随机森林回归
from sklearn.model_selection import cross_val_score # 交叉验证
Read more »

post_asset_folder开启的话,便是这种情况,一篇文章一个文件夹,用来放置图片[1],自己的文章图片都是使用图床,所以无需这个设置,但是开启一次之后再关闭,之前的文章还是一篇文章一个文件夹。

Read more »

实现大陆访问,使用coding(大家可以理解为中国版的github),国外访问,使用github,以及可以提交百度收录(GitHub 禁止了百度的爬取)[1]

暂时停止折腾了,coding 代码迁移是可以,但是静态网站功能的实现不好搞,coding停掉,需要借助腾讯云搭建。很久之前也尝试过gitee,那段时间直接停掉静态网站的搭建功能,目前不清楚。。。

Read more »

需求:在使用 pycharm 或 vscode 时,对切换 python 的版本,以及安装的包的位置等环境问题,比较模糊。

该文章解决一下问题:

  • 如何使用 conda 创建环境,如何下载指定版本的包到指定的环境
  • 下载的包在本地的哪个目录
  • pycharm 和 vscode 如何使用 conda 的环境
Read more »
+