查看原文
其他

数据分享|中国土地市场网土地出让数据(含经纬度,2000~2019 年)R 语言 + Stata + Excel 格式

RStata RStata 2022-05-17

整理不易,感谢大家帮忙分享,关注本公众号(RStata)然后在公众号后台发送 1211 即可获知免费下载的方式。该数据为限时免费分享,截止时间为 2020 年 12 月 13 日晚 8 点,过期不再免费分享。另外你也可以从 RStata 平台上获取:https://rstata.duanshu.com/ (扫描开头二维码或点击文末的阅读原文即可跳转)

为了方便大家使用,今天新增了供 Excel 打开的 Excel-CSV 格式和供 R 语言读取的 rds 格式的两份数据文件。

花了好大的功夫终于把中国土地市场网的土地出让数据整理好了(超过 250 万个观测值),并且给每个地块解析了经纬度,不过由于高德地图地理编码接口并不是非常支持像“某某地块”这样的地址,所以解析的经纬度很多是错误的,为了避免误导大家,我将一些明显错误的经纬度抹去了(尽管如此,剩下的经纬度可能还是有错误,请谨慎使用),另外高德地图接口解析得到的是 GCJ02 坐标系的经纬度,我已经转换成了 WGS84 坐标系的,可放心使用。于是就得到了这份土地出让数据。

为了方便大家使用,我提供下面四个格式:

  1. 土地出让数据2000~2019(经纬度已转).dta
  2. 土地出让数据2000~2019(经纬度已转).csv (Excel 打开会乱码)
  3. 土地出让数据2000~2019(经纬度已转)_excel.csv (Excel 打开不会乱码)
  4. 土地出让数据2000~2019(经纬度已转).rds

使用 R 语言读取:

library(readr)
read_rds('土地出让数据2000~2019(经纬度已转).rds')

使用 Stata 读取:

use "土地出让数据2000~2019(经纬度已转).dta", clear

Stata 格式的数据表是这样的:

包含如下变量:

  • ID
  • 网址链接
  • 省份
  • 城市
  • 区县
  • 电子监管号
  • 项目名称
  • 项目位置
  • 面积_公顷
  • 土地来源
  • 土地用途
  • 供地方式
  • 土地使用年限
  • 行业分类
  • 土地级别
  • 成交价格_万元
  • 土地使用权人
  • 约定容积率_下限
  • 约定容积率_上限
  • 批准单位
  • 经度(已经转换成 WGS84 坐标)
  • 纬度(已经转换成 WGS84 坐标)
  • 约定交地时间
  • 约定开工时间
  • 约定竣工时间
  • 合同签订日期

例如我简单使用这份数据绘制了 2019 年的数据中各地块的地理分布:

还有各市 2019 年的平均地价:

注意事项

  1. 所有的地址都是使用高德地图接口批量解析的,可能包含部分解析错误的观测值,请谨慎使用;
  2. 由于地块数据是 2000~2019 年的,里面的地址自然也是 2000~2019 年的,而高德地图接口返回的经纬度是最新地址的,这也可能导致经纬度错误;
  3. 高德地图接口解析得到的是 GCJ02 坐标系的经纬度,我已经转换成了 WGS84 坐标系的,可放心使用。

获取数据

整理不易,感谢大家帮忙分享,关注本公众号(RStata)然后在公众号后台发送 1211 即可获知免费下载的方式。该数据为限时免费分享,截止时间为 2020 年 12 月 13 日晚 8 点,过期不再免费分享。另外你也可以从 RStata 平台上获取:https://rstata.duanshu.com/ (扫描开头二维码或点击文末的阅读原文即可跳转)

你也可以从 RStata 平台上购买这份数据:https://rstata.duanshu.com/ (点击文末的阅读原文即可跳转)。

可以选择购买 SVIP、VIP 会员卡或数据资料卡获取这份数据,也可以单独购买。


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存