欢迎加入 TidyFriday !
现在加入即可享受 8 折优惠! See: https://czxa.top/posts/34814/
最近长春长生疫苗案件超级火啊,昨天伍老师还分享给我一片微信推文我花了 14 个小时找了一下长春长生们究竟卖到了哪里去,读后感觉很有趣,所以就打算模仿原作者的思路自己也分析一波。为了省事,我就没有自己整理数据,而是直接使用了原作者开源的数据分析的,点击这里即可下载。
感谢伍老师的分享,感谢推文作者提供的开源数据。
下面我将使用自己最擅长的 Stata 进行分析。
下面的代码可以实现作者在推文中提到的 csv 整合:1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39cd "/Users/mr.cheng/Desktop/fuckcqcs-master/csv/"
import delimited 安徽省.csv, encoding(utf8) clear
drop in 1/123
save final, replace
fs *.csv
foreach i in `r(files)'{
import delimited `i', encoding(utf8) clear
append using final.dta, force
save final, replace
}
use final, clear
destring price, replace force
drop 序号 品名 供应商生产企业 计量单位 中标价元
compress
* 下面的代码可以把字符串转换成带数值标签的数值型变量,但是后来发现没有必要,于是就把它们注释掉了。
* encode create_company, generate(cc)
* encode report_company, generate(rc)
* encode name, gen(name2)
* encode src, gen(source)
* encode prov, gen(prov2)
* drop name-prov
* ren cc create_company
* ren rc report_company
* ren name2 name
* ren prov2 prov
* ren source src
label var name "药名"
label var src "国产/进口"
label var create_company "生产企业"
label var report_company "申报企业"
label var prov "省份"
label var year "年份"
label var price "价格"
order prov year src name create_company report_company price
sum create_company
replace create_company = subinstr(create_company, " ", "", .)
replace create_company = subinstr(create_company, " ", "", .)
replace prov = "浙江省" if prov == ""
save final, replace
得到的数据是下面这个样子的:
注意到我这里得到了 1676 条数据,而原作者是 1529 条数据,这是因为有好心的网友又整理了甘肃省的数据。
下面我也按照作者的思路分析。
下面的代码即可实现对生产企业数量的统计分析:1
2
3
4
5
6use final, clear
encode create_company, generate(cc)
contract cc
sum _freq
gr box _freq, yti("生产企业的数量") ti("图:生产企业数量的箱线图") plotr(margin(vlarge))
gre cccsbox
每家生产企业数量的一些基本统计量为:1
2
3
4
5. sum _freq
Variable | Obs Mean Std. Dev. Min Max
-------------+---------------------------------------------------------
_freq | 175 9.577143 17.31698 1 102
显然这是一个非常右偏的分布,“也就是说,绝大多数的药都被大厂垄断。”
例如数量排在前十的厂家和其中标数量如下:1
2
3
4
5use final, clear
contract create_company
drop if create_company == ""
gsort -_freq
list in 1/10
长春长生这家公司就排在第二位!
1 | use final, clear |
结果:
prov | ratio(%) |
---|---|
上海市 | 3.28 |
吉林省 | 8.93 |
四川省 | 8.06 |
宁夏回族自治区 | 5.00 |
安徽省 | 3.25 |
山西省 | 8.70 |
广东省 | 6.72 |
新疆维吾尔自治区 | 7.63 |
江苏省 | 6.80 |
江西省 | 5.81 |
海南省 | 12.24 |
贵州省 | 6.72 |
辽宁省 | 8.40 |
黑龙江省 | 4.42 |
用地图展示的结果如下:
无数据的省份可能是没有采购过长春长生集团的药品也有可能是因为确实没有数据。
绘图代码(R 语言的 leafletCN 包绘制)如下:1
2
3
4
5
6
7
8
9
10
11
12library(leafletCN)
df <- data.frame(
prov = c("上海", "吉林", "四川", "宁夏", "安徽", "山西", "广东", "新疆", "江苏", "江西", "海南", "贵州", "辽宁", "黑龙江"),
value = c(3.28, 8.93, 8.06, 5.00, 3.25, 8.70, 6.72, 7.63, 6.80, 5.81, 12.24, 6.72, 8.40, 4.42)
)
geojsonMap(df, "china",
namevar = ~ prov,
valuevar = ~ value,
palette = "YlOrRd",
legendTitle = "占比",
popup = paste0("长春长生在总招标中的占比:", df$value, "%"))
作者的分析到这里就结束了。我还想做一些额外的分析。
使用我写的stkd
命令可以非常容易的查询一家上市公司的基本信息,这个命令位于我的 finance 命令包里:finance。1
stkd 002680
该命令可以产生下面的结果:
项目 信息
【基础信息】
公司简称 长生生物
股票代码 002680
公司全称 长生生物科技股份有限公司
公司英文名称 ChangshengBio-technologyCo.,Ltd.
曾用名 黄海机械
成立日期 2006-08-11
所属行业 制药
所属概念 股权激励 抗癌 深港通
所属地域 江苏
法定代表人 高俊芳
独立董事 徐泓 沈义 马东光
咨询服务机构 北京市康达律师事务所
会计师事务所 致同会计师事务所(特殊普通合伙)
证券事务代表 桂巍
【工商信息】
注册资本 97,369.04
注册地址 江苏省连云港市海州开发区秦东门大街 1 号
所得税率 15.00
办公地址 吉林省长春市高新开发区越达路 1615 号
主要产品(业务) –
【经营范围】 生物制剂的研发;生物科技项目的投资;生物技术相关项目的技术服务和研究开发;自营和代理各类商品和技术的进出口业务,但国家限定企业经营或禁止进出口的商品和技术除外。(依法必须批准的项目,经相关部门批准后方可开展经营活动)***
【证券信息】
发行日期 2012-05-25
上市日期 2012-06-05
上市交易所 中小企业板
证券类型 流通 A 股
流通股本 40,265.54
总股本 97,369.04
主承销商 浙商证券股份有限公司
发行价 21.59
上市首日开盘价 31.10
上市首日涨跌幅 47.75%
上市首日换手率 81.06%
特别处理和退市 无
发行市盈率 24.53
最新市盈率 18.10
【联系方式】
联系电话(董秘) 0431-81874554
公司传真 0431-81874554
电子邮箱 [email protected]
公司网址 china.cs-vaccine.com
联系人 赵春志
邮政编码 130103
【公司简介】 发行人系 2010 年 11 月 5 日经黄海机械公司股东会同意,以截至 2010 年 5 月 31 日经审计的净资产 121,407,296.83 元为基准,按 1:0.4942 的折股比例折合股份,以整体变更方式发起设立的股份有限公司,设立时的注册资本为 6,000 万元。2010 年 11 月 22 日,连云港黄海机械股份有限公司创立大会暨第一次股东大会审议通过了设立股份有限公司的议案,并选举产生了第一届董事会和第一届监事会。2010 年 11 月 25 日,发行人取得了江苏省连云港工商行政管理局核发的注册号为 320700000055905 的《企业法人营业执照》。
如果你觉得非常讨厌这家公司,可以给它的董秘打电话📲
。
使用前几天我最新写的一些绘制蜡烛图的命令可以展示最近长春长生的股价变化状况。这些命令还没有在前面的博客中介绍,最近会介绍的。你会需要下面的几个文件:
cntrade2.ado
cntrade2.sthlp
kline2.ado
stkpv2.ado
stkpv3.ado
stkpv4.ado
Stata+ECharts 绘制蜡烛图+均线1
kline2 1, start(20180601)
绘制股价棒状图1
stkpv2 002680, start(20180601)
绘制蜡烛图。1
stkpv3 002680, start(20180601)
这个版本的命令可以在蜡烛图上添加 MA 线。例如添加 MA5、MA10、MA15。1
stkpv4 002680, start(20180601) add(5 10 15)
显然疫苗事件对长生生物是重大利空,最近几天其股价已经连续跌停多日。
Update your browser to view this website correctly. Update my browser now