数据可视化之散点图和折线图
画图基本常用参数
plt.figure(figure_size=(30,20)) 指定图片大小
plt.style.use('ggplot') 指定图片风格
plt.title("image title",fontsize=30) 指定图片标题
指定坐标轴相关
my_x_trick = np.arrange(0,200,10)
plt.xtricks(my_x_trick,fontsize=20,rotation) 指定x轴,fontsize指定坐标轴字体,rotation指定文字旋转的角度
plt.ytricks(fontsize=20) 指定y轴
指定画图类型
1.折线图
plt.plot(x,y) #不指定画图种类时默认为折线图
plt.legend(loc = "best",fontsize=40,shadow=1) #进行图例格式设定
plt.show()
折线图中plot可用参数:
1.color=’red’ 指定折线的颜色
2.label=’price’ 指定改颜色的图例表示
3.marker=’-‘ 设置折现格式,默认为’-‘,注意这里设置范围不要越界,当设置越界时转换其他图
在一个文件中多次调用plt.plot(),使用不同的数据指定不同颜色和label可在一个图中画多条折线进行对比
2.散点图
方式一:
plt.scatter(x1,x2,marker='o') #指定画散点图,marker为点的形状
plt.show()
方式二:
plt.plot(x1,x2,marker='o') #plot使用marker=‘o’则为散点图
plt.show()
在实际情况中第二种方式更为灵活,因此我们下重点介绍第二种方式的参数情况。
散点图中常用参数(方式二):
- markerfacecolor 散点内部颜色
- markeredgecolor 散点边缘颜色
- markersize 散点大小
下面我们以DBSCAN聚类后的结果进行将为可视化为例进行效果展示:
from sklearn.manifold import TSNE
#使用TSNE进行降维
tsne = TSNE(learning_rate=100)
x = tsne.fit_transform(input)
labels = dbscan.labels #获取最终的预测结果
unique_labels = set(dbscan.labels)
colors = plt.cm.Spectral(np.linspace(0,1,len(set(dbscan.labels_)))) #生成和标签种类数相同的颜色数组
core_samples_mask =np.zeros_like(dbscan.labels_,dtype=bool)
core_samples_mask[dbscan.core_sample_indices_] = True #将核心对象点对应的位置置true
plt.style.use(‘ggplot’)
plt.figure(figsize=(30,20))
for k,col in zip(unique_labels,colors):
if k==-1:
col=’k’
class_member_mask = (labels==k)
xy = x[class_member_mask & core_samples_mask]
plt.plot(xy[:,0],xy[:,1],’o’,markerfacecolor=col,markeredgecolor=’k’,markersize=10)