找回密码
 立即注册
查看: 173|回复: 0

第03集-stata作图常用命令集-写论文

[复制链接]
发表于 2023-3-26 07:44 | 显示全部楼层 |阅读模式
需求:最近老师想让我们写一篇关于用python或者r软件进行简单作图的小论文,我就结合对于stata的简单学习,写一篇相应的小论文,有需要的朋友可以直接借鉴,做任何事情需求优先嘛!开始干!!!
开始先学点基础东西:
一.图像处理合集

  • 资源
1.1 stata自带的资源
1.1.1 stata16自带的文件说明;在docs文件夹下面,stoc是汇总各个分模块大标题的一个文档,可以找到具体相应编号的文档。




知道大家不想看书,那看看这篇文章也行,快速上手。
1.1.2 help graph


1.2 附加的资源
链接:https://pan.baidu.com/s/1VDdDSAAG2idKhx49sJhY2w
提取码:6666

小绿鲸英文文献阅读器,妈妈再也不用担心我看不懂英文文档了,推荐大家安利一波。
家庭富裕的小伙伴也可以选择这类智能产品哦,流畅程度肯定没得说。

链接:https://pan.baidu.com/s/1uxJzo5EZq0DNPA7YlqnysQ
提取码:6666

2. 图形处理基础步骤
2.1 图形处理方案
2.1.1 导入命令
找到自己需要的模块,比如我想学习关于作图
先需要学习  graph twoway 这种基本命令语句
之后会进一步学习graph twoway scatter(散点图)
2.1.2 附加命令
在熟悉基本语句之后,会学习相关的图像处理附加语句
图像会做了之后,我们希望它更加美丽,更加符合我们论文的需要,所以需要做相应的图像处理语句的学习。
比如:title options(标题的选择和处理)
2.1.3高级命令
对基本处理有了了解和运用就能够对高级命令开始了解和运用了

2.2实例导入
先通过简单的案例来导入一下上面的学习步骤:
2.2.1基本处理
use https://www.stata-press.com/data/r16/auto
#导入stata外部链接数据
graph twoway scatter mpg weight
#用mpg,weight这两个变量制作一个散点图


twoway scatter mpg weight, by(foreign)
#图形组合显示,


twoway (scatter mpg weight) (lfit mpg weight)
#加条预测线,括号代表一起显示


twoway (qfitci mpg weight, stdf) (scatter mpg weight), by(foreign)
加上预测的置信区间,结合相应的可以选择的置信度stdf(95%)



2.2.2附加条件-图形编辑
图形编辑器的形式
功能区介绍


启动:点住图像鼠标右键启动图形编辑器
移动或者更改属性:可以通过鼠标直接调整相应的标签位置,选中对象右键可更改属性,包括文本,位置等内容。


2.2.3综合运用
use https://www.stata-press.com/data/r16/uslifeexp
合起来的代码: twoway line le_wm year, yaxis(1 2) xaxis(1 2)|| line le_bm year|| line diff year|| lfit diff year||,ytitle( "",axis(2) )xtitle( "",axis(2) )xlabel(1918,axis(2) )ylabel( 0(5)20, axis(2) grid gmin angle(horizontal)  )ylabel( 0 20(10)80,gmax angle(horizontal) )ytitle("Life expectancy at birth (years)" )ylabel(, axis(2) grid)title( "White and black life expectancy" )subtitle( "USA, 1900-1999" )note( "Source: National Vital Statistics, Vol 50, No. 6""(1918 dip caused by 1918 Influenza Pandemic)" )legend( label(1 "White males") label(2 "Black males") )


3.命令学习
3.1基础命令
3.3.1绘图命令
基本语句:graph twoway plot(绘图类型) if(筛选条件) in(可选范围), twoway options(可选项)
绘图类型:scatter(散点图)scatteri(带极端值标注的散点图)line(线图)area(带阴影的线图) lfit(线性预测图)connected(连通线图)bar(柱状图)dot(圆点图)

可选项:

3.2.2各类方案选择:

3.2存储命令
graph save
将图形保存到磁盘
graph use
重新显示存储在磁盘上的图形
graph display
重新显示存储在内存中的图形
graph combine
组合多个图
graph replay
重新显示存储在内存和磁盘上的图形

3.3打印命令
graph print
打印当前显示的图表
set printcolor
设置如何打印颜色
graph export
导出gph文件到PostScript等

3.4处理内存命令
graph display
显示图
graph dir
列表名称
graph describe
描述内容
graph rename
重命名内存图
graph copy
将内存图复制到新名称
graph drop
丢弃内存中的图形
graph close
关闭图形窗口
3.5涉及图像处理方案
graph query, schemes
列出可用方案
graph query
列出可用样式
query graphics
识别默认方案
set scheme
设置默认方案
graph set
设置图形选项
set graphics
设置是否显示图形

4.总结写篇绘图的小论文

数据可视化的介绍和运用
摘要:对于数据可视化是统计行业的比较热度的一个词语,对于数据可视化主要是把我们获取到的数据,通过r软件;python等相关软件进行一定的处理,使得数据呈现出能让读者更加清楚理解数据的本质,更能看懂数据的分布,趋势,规律,来辅助决策者更加好的做出决策;本文主要是通过不同软件处理数据可视化的体验来介绍不同软件用来可视化的一些特点和优势,以此来介绍数据可视化的相关运用,得出一些适合不同特性的人使用的软件类型。
关键词:数据可视化;r软件;python


一、常见的数据可视化处理概述
数据可视化是一种将数据以图表、图像、图形或仪表盘的形式呈现出来的技术,可以帮助人们快速理解和分析大量数据。数据可视化可以帮助人们更好地理解和分析数据,从而更好地决策。
数据可视化的好处有很多,例如可以更快地提取有效信息,更容易理解复杂的数据,更容易发现趋势和模式,以及更容易比较不同数据集之间的差异。此外,数据可视化还可以帮助人们更好地沟通和分享信息。
数据可视化的类型有很多,例如折线图、柱状图、饼图、散点图、热图、时序图、地图等。每种类型的数据可视化都有自己的优点和适用场景,人们可以根据自己的需求选择合适的数据可视化类型。
数据可视化所能采用的工具也有许多的类别,比如一般数据处理软件类:excel,FineBI ,Tableau等软件;编程类软件:python的visual code,r软件,SAS等相关编程类的软件;功能和特性也各自有较大差异。
总而言之,数据可视化是一种有效的数据分析和决策工具,可以帮助人们快速理解和分析大量数据,更好地沟通和分享信息,并有助于更好地决策

二、图形处理的基本流程
广义上的数据可视化的分析基本流程主要包括如下几个步骤:
1.数据收集:从数据源中收集所需要的数据;常见的数据源收集的来源渠道有公开出版物:中国《中国统计年鉴》《中国社会统计年鉴》《中国人口统计年鉴》《世界经济年鉴》《世界发展报告》等统计年鉴或者出版物;政府官网:中国政府网,中国政策研究网等政府官网中都可以获取较多的数据;行业研究数据库:艾梅网,wind数据库,36氪,行行查等相关行研数据库。
2.数据清洗:对收集的数据进行清洗,清除异常值,缺失值等;根据相应的研究目的设置相应的筛选条件,对问卷的数据进行一个简单的筛选,常见的数据筛选条件有用时,漏,错填,逻辑错误,重复填写,ip地址,信度效度结果筛选等筛选条件;对于数据缺失值的填补,目前常用的方法有:直接删除法,前后填充,均值~众数~中位数填充,插值法等填充手法。
3.数据可视化:使用可视化工具,将数据可视化,比如折线图、柱状图、饼图、散点图、热图、时序图、地图等等;同时也包括对业务进行指标化处理的阶段,根据业务目标设立相应的业务检测指标,之后通过相应的软件对其进行一个可视化的反应。
4.数据分析:对数据进行分析,挖掘出数据的有效信息;这个过程主要是结合有效信息进行挖掘,提出对业务的一些改进措施和有效的结论。
5.报告编写:对数据分析结果进行总结,编写报告,提出建议。
三、数据可视化处理的相关程序及呈现
(一)图形处理基于stata命令
1、散点图
(1)数据导入:use https://www.stata-press.com/data/r16/auto
(2)命令导入:graph twoway scatter mpg weight
(3)数据图:


(4)其他优化:
twoway scatter mpg weight, by(foreign)    #引入分类变量


scatter mpg weight, by(foreign, total row(1))


twoway (scatter mpg weight) (lfit mpg weight),by(foreign)   #引入“和”和预测线


twoway (qfitci mpg weight, stdf) (scatter mpg weight), by(foreign) #加预测区间


2、线图
(1)数据导入:use https://www.stata-press.com/data/r16/uslifeexp
(2)命令导入:twoway line le_wm year || line le_bm year
(3)数据图:


(4)其他优化
generate diff = le_wm - le_bm
label var diff "Difference"
twoway line le_wm year, yaxis(1 2) xaxis(1 2)|| line le_bm year|| line diff year|| lfit diff year||,ytitle( "",axis(2) )xtitle( "",axis(2) )xlabel( 1918,axis(2) )ylabel( 0(5)20, axis(2) grid gmin angle(horizontal))ylabel(0 20(10)80,gmax angle(horizontal) )ytitle( "Life expectancy at birth (years)" )ylabel(, axis(2) grid)title("White and black life expectancy" )subtitle( "USA, 1900-1999" )note( "Source: National Vital Statistics, Vol 50, No. 6""(1918 dip caused by 1918 Influenza Pandemic)" )legend( label(1 "White males") label(2 "Black males") )


3、柱状图
(1)数据导入:use https://www.stata-press.com/data/r16/sp500
标准普尔指数:change(变化量)


(2)命令导入:
replace volume = volume/1000       #替换变量
twoway rspike hi low date ||line close date ||bar volume date, barw(.25)yaxis(2) ||in 1/57, yscale(axis(1) r(900 1400))yscale(axis(2) r( 9 45))ytitle("Price -- High, Low, Close")ytitle(" Volume (millions)", axis(2) bexpand just(left))legend(off)subtitle("S&P 500", margin(b+2.5))note("Source: Yahoo!Finance and Commodity Systems, Inc.")
(3)数据图:


(4)其他优化
4、线箱图矩阵
(1)数据导入:use https://www.stata-press.com/data/r16/lifeexp, clear
(2)命令导入:
generate lgnppc = ln(gnppc)
graph matrix popgr lgnppc safe lexp
(3)数据图:


(4)其他优化
5、箱型图
(1)数据导入:use https://www.stata-press.com/data/r16/bplong, clear
(2)命令导入:
graph box bp, over(when) over(sex)
(3)数据图:


(4)其他优化
graph box bp, over(when) over(sex)ytitle("Systolic blood pressure")title("Response to Treatment, by Sex")subtitle("(120 Preoperative Patients)" " ")note("Source: Fictional Drug Trial, StataCorp, 2003") #加了点标题


6、饼状图
(1)数据导入:
input sales marketing research development
12 14 2 8
end
(2)命令导入:
graph pie sales marketing research development,
plabel(_all name, size(*1.5) color(white))legend(off)plotregion(lstyle(none))title("Expenditures, XYZ Corp.")subtitle("2002")("Source: 2002 Financial Report (fictional data)")
(3)数据图:


(4)其他优化
Year   sales marketing research development
2001 3 4.5 .3 1
2002 4 3 .5 2
2003 4 4 .6 2
2004 2 2.5 .6 3
Graph pie sales marketing research development,plabel(_all name, size(*1.5)color(white))by(year,legend(off)title("Expenditures, XYZ Corp.")note("Source: 2002 Financial Report (fictional data)"))


7、柱状图
(1)数据导入:use https://www.stata-press.com/data/r16/nlsw88
(2)命令导入:graph bar wage, over(smsa) over(married) over(collgrad)
graph bar wage,over( smsa, descend gap(-30) ) over( married ) over( collgrad, relabel(1 "Not college graduate"2 "College graduate" ) )ytitle("")title("Average Hourly Wage, 1988, Women Aged 34-46")subtitle("by College Graduation, Marital Status,and SMSA residence")note("Source: 1988 data from NLS, U.S. Dept of Labor,
Bureau of Labor Statistics")
(3)数据图:


(4)其他补充
use https://www.stata-press.com/data/r16/educ99gdp
generate total = private + public
graph hbar (asis) public private, over(country)


graph hbar (asis) public private,over(country, sort(total) descending)stack title("Spending on tertiary education as % of GDP,1999", span position(11) )subtitle(" ")note("Source: OECD, Education at a Glance 2002", span)



(二)图形处理基于r命令
1、时序图
(1)数据导入:
yield<-c(15.2,16.9,15,3,14.9,15.7,15.1,16.7)
yield<-ts(yield,start=c(1884))
(2)命令导入:
plot(yield)
(3)数据图:


(4)其他优化
plot(yield,type="h") #引入不同类型的图像





plot(yield,type="o",pch=8,lty=2,lwd=2,col="red")   #依次调节标记类型,线段类型,线段长短,线段颜色。


plot(yield,main="1884-1890年英格兰和威尔士地区小麦平均亩产量",xlab="年份",ylab="亩产量)              #进行标签书写总标题,副标题,横纵标题


abline(v=c(1887,1889),lty=2) #对x轴添加标记线
abline(h=c(10.5,12.5),lty=2,lwd=2,col="red",pch=9) #对y轴添加标记线
2、自相关图
(1)数据导入:
yield<-c(15.2,16.9,15,3,14.9,15.7,15.1,16.7)
yield<-ts(yield,start=c(1884))
(2)命令导入:
acf(yield)
(3)数据图:


3、条形图
(1)数据导入:
library(vcd)
counts<-table(Arthritis$Improved)
counts
(2)命令导入:
barplot(counts,main="简单的条形图",xlab="Improvement",ylab="Frequency")
(3)数据图:


(4)其他优化
plot(counts,main=”条形图”,xlab="Treatment",ylab="Frequency",col=c("red","yellow","green"))


barplot(counts,main=”分组条形图”,xlab="Treatment",ylab="Frequency",col=c("red","yellow","green"),beside=T,legend=rownames(counts))


4、散点图
(1)数据导入:
x<-rnorm(100)
y<-2*x+rnorm(100)
(2)命令导入:
plot(x,y,main="Linearly correlated random numbers",xlab="x",ylab="2*x+noise",xlim=c(-4,4),ylim=c(-4,4))
(3)数据图:


(4)其他优化
plot(x,y,pch=if else(x*y>1,16,1),main="scatter plot with conditional point styles")


z<-sqrt(1+x^2)+rnorm(100)
plot(x,y,pch=1,xlim=range(x),ylim=range(y,z),xlab="x",ylab="values")
points(x,z,pch=17)
title("scatter plot with two series")


plot(x,y,pch=16,col=ifelse(y>=mean(y),"red","green"),main="scatter plot with conditional colors")


plot(x,y,pch=16,col=ifelse(y>=mean(y),"red","green"),main="scatter plot with conditional colors") plot(x,y,col="blue",pch=0,xlim=range(x),ylim=range(y,z),xlab="x",ylab="value") points(x,z,col="red",pch=1)
title("scatter plot with two series")


5、线图
(1)数据导入:
t<-1:50
y<-3*sin(t*pi/60)+rnorm(t)
(2)命令导入:
plot(t,y,type="l",main="single line plot")
(3)数据图:


(4)其他优化
p<-40
plot(t[t<=p],y[t<=p],col="red",type="l",xlim=range(t),xlab="t") lines(t[t>=p],y[t>=p],col="blue",lty=2)
plot(y,type="l")
points(y,pch=16)



x<-1:30
y<-2*x+6*rnorm(30)
z<-3*sqrt(x)+8*rnorm(30) plot(x,y,type="l",ylim=range(y,z),col="black")
points(y,pch=15)
lines(z,lty=2,col="blue")
points(z,pch=16,col="blue")title("plotoftwoseries") legend("topleft",legend=c("y","z"),col=c("black","blue"),lty=c(1,2),pch=c(15,16),cex=0.8,x.intersp = 0.5,y.intersp=0.8)



四、数据可视化处理实战案例
总结
对于各种软件都有各种软件的相关的特性,我们只需要根据特性选择相应的方法来进行处理即可,对于STATA软件更多的师体现在计量经济学方面的优势,相对来说用处较大;而对于r软件以及python软件更多的是依赖于相应的库,主要的优势是方便,并且功能强大,比较丰富,但是对于软件所需要的能力要求比较高。所以我们根据自己需求定位选择合适的软件进行学习,并且用于之后的论文以及生活的证明上,帮助我们更好的论证相应的观点。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
懒得打字嘛,点击右侧快捷回复 【右侧内容,后台自定义】
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Unity开发者联盟 ( 粤ICP备20003399号 )

GMT+8, 2024-4-29 15:35 , Processed in 0.122975 second(s), 28 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表