导读:特征价格模型是房地 研究中常用的 典模型,其特征指 往往基于研究者 往 及偏好来 取, 土地评估,资产评估,商标评估,软件评估房者情感偏好考 不足。基于房地 网 平台上丰富的在 用 ,挖掘其所 含的 房者情感偏好,建立体 用 关注的房地 特征价格模型,并以合肥市 例,采集148 楼 数据 行 研究。 评估公司,评估机构,固定资产评估,价格评估果表明,“区位”“ 型”“装修”“生活配套”“物 量”“ 化 境”“交通”“学区” 房者 著偏好的房地 特征指 ,而依据 些特征指 构建的房地 特征价格模型能 合理地 估房地 特征属性的 含价格,具有良好的 合度和 高的解 能力。关 :在 ;商品特征;特征价格模型
特征价格模型( , )自 成,价格由所有特征属性带给人们的效用共同决
hedonicpricemodel HPM
[ ] 定。由于各个特征属性的数量及 合方式不同,房
生以来就被广泛用于房地 价格 估1-3 。房地
是一种最典型的异 性商品,不同住宅在建筑、 地 价格就会 生差异。通 位特征属性的边
里、区位等属性方面都可能存在显著区别。因 效用 化分析来 估 种特征属性的 含价格,
此, 特征 量的合理与否是正确构建 HPM 的 即 Hedonic价格 [4]。 ,
因此 哪些特征属性 入
关 。就 有文献 察来看, 些特征 量往往基 特征价格模型中就非常重要, 漏 量或 量
于研究者的 往 及偏好 取,不同研究 取的 将 致参数估 不准确[9]。
特征 量各不相同,其构建的模型方程也有差异。 通 和 相关 域的国内外文献 ,
相应地,不同方程所表现的拟合度也会有所 ,
早在20世 80年代就有学者指出 尽管Rosen的
[ ] 含市 理论构建了hedonic实证研究的基本框
差异4-6 。
, , 架,但并未 量及函数形式的 提供明确的指
近年来 随着电子商 的迅猛 展 在线评论
作 一种新型情 源,成 商家挖掘用 需求、提 [ ] ,
导 10-13 。
在 多 研究中 Hedonic模型中变量
[ ] 的 也往往是研究者凭借主 判断确定,并没有
升用 意度的重要数据 7-8 。 于 房者而
, 做 致深入的分析。以国内研究轨道交通对房地
言 他 在 下 地看房的前后也会去房地 网
、 价格影响 域的文献 例,大部分文献 住宅的
平台搜索 所看房源的 价 房源周 施的 价
, 。 基于 构特征,即面积、楼层、房龄等因素考虑较为周
等相关在 从而做出相 的 房决策
此,本文 利用房地 网 平台中的在 挖 全,但在教育 源和生活配套的一些重要特征 量
掘出 含的 房者情感 向 提取 房者在形成 上却千差万别 [ ]
, 14-20
, 象,即属于 中小学划片分配的住宅价格 著高
决策 著偏好的房源特征 在此基 上 取特
, 于非划片区域。教育 源的 与否极有可能影
征 量来构建特征价格模型 从而 房地 行 的
生 决策和 房者的消 行 提供参考。 响 道交通 沿 住宅价格的溢价水平。与此同
1 文献 述 时, 多研究 了减少 漏变量带来的偏差,几乎
根据Lancaster的消 者效用理 和Rosen的 所有的HPM 研究都会在模型中 入大量的特征
含市 理论,房地产由诸多不同的特征属性组 量,而使用大量的特征变量进行估计时,会产生高
收稿日期:2022-06-14
作者 介: 沁娜(1978—),女,山西沁水人,合肥工 大学管理学院,副教授,博士, 士研究生 ,研究方向 源 境 与政策;李航(1997—),男(苗族),湖南湘西人,合肥工 大学管理学院, 士研究生,研究方向 源 境 。
221
科技和 第22卷 第11期
[ ] , ,
度的共 性 12-21 。
由此可 有必要 Hedonic模 构建体 用 关注的房地 特征价格模型方法 并
型的特征 量 展开研究。 以合肥房地 市 研究 象 行 研究,分析
得关注的是,近年来,随着电子商务的迅猛 每个特征属性 住宅价格的影响。
展,在 用 作 一种新型情 源,成为商 2 研究方法
家挖掘用户需求、提升用户满意度的重要数据资 在 用 代表着消 者的 点、 度和情
产。特 是机器学 、自然 言 理理 和方法的 感,利用 品特征提取工具可以从中挖掘消 者关
日益成熟,加速 放了海量在 数据的价值。 注和偏好的 品特征。 不 能 应用于 品推
从 有文献梳理来看,目前学者 主要通 在 荐, 能 帮助商家 并改进产品的不足,从而
数据挖掘开展 品特征提取和用 情感分析,进 增 品的 争力。当前 品特征提取方法主要
而 行用 需求分 和 品 化的相关研究, 有基于关联规则、词频和词共 的提取方法 [ ]
35-37 ,
[ ] [ ] [ ]
应用领域主要集中在购物 22-23 旅游 24-25 电
、 、 基于句法依存的提取方法 38-40 基于改进的LDA
[ ] [ ] , [41-43] [44-46]
影 26-27 、 28-29 提取方法 等。
酒店 等 研究方法也从逐步从传统统 ,基于机器学习的提取方法
方法 展到了机器学 。周立欣等从京 购物 本文参考借 了李 卿等提出的基于同义词林与
平台收集在 构建特征情感的二分加 网 , [46]
向量的 品特征提取及 构建方法 ,
- 首先采
, 用人工 注提取和同 林 展形成种子 ,随
并 行仿真 按照用 品特征的重 程度
品特征 行了排序[30]。Zhou等提出了奇异 后使用Word2vec 和大 模 数据 行模型
, 练,完成 相 度 算与属性归并,形成 品特
分解的 关 相似度的方法 通 用于在
用 商品的 度, 企 改 商品性 [ ]
征 典47-49 。具体流程如 1所示。
能提供依据[31]。 丹萍等基于 Word2vec 和滑 窗 ) 。 采集房地产网络
1 行数据采集与预处理
, 平台上的 本楼 在线用 评 数据。之后利用
口技 分析iPhone手机在 合感性工学理
更有效地捕捉用 的感性需求[32]。刑云菲等以 Python 中的 行分 , 合停用 典,删
jieba
TripAdvisor网站 例,采集北京、上海、深圳和广 除与房地 特征无关的 ,并按 行降序排
州4个城市的酒店用 在 内容构建主题图 , ,
列 去除低 和高 非特征词 得到可用于后续
谱,并分析 以及 体的社会网 特征,发现不 研究的数据集。
同地区酒店的用 需求存在差异化 [33]。 等 ) 。 随机抽取样本楼盘中的部
2构建种子词库
抽取知乎直播用 的消极 ,以 粒度 点的方 分 数据,采用人工方式 行 注、 并与分 ,
法建立特征体系,揭示了知乎直播存在的缺陷和不 利用 些 中所提到的 品特征,建立特征种子
足[34]。 房地 域而言,在房地 网 平台上的 词库。并以提取出的种子 基准,通 哈工大同
在 中, 价内容丰富,包括房源建筑 构、小 林 种子 行 展。
、 , ) 。 将完成数据清洗预处理
区 境 周 施及入住感受等 能 真 地反映 3 行 向量训练
房者 房源的 期期望和实际入住体 。基于 后的 本楼 在 用 文本分词后作为训练
此,本文提出通 挖掘房地 网 平台上在 料, 定合适的蚕食,借助Word2vec中的Skip-
所 含的 房者情感偏好,提取房地 特征属性来 gram模型或CBOW 两个模型 行 向量 ,得
图1 房地 特征属性提取流程
222
沁娜等:基于用 关注的房地 特征价格模型构建研究
到候 特征 的 向量。
4)形成 品特征 。模型 完成之后,计算候 特征 和种子 中各个 之 的语 相似度及相关度,并将相似度大的候 特征 加入种子 中,形成最 的 品特征 。
5) 品特征词库进行分类。为了更清晰明了地展示 品特征属性,需要将最 取的 品特征 按照其描述方面的不同 行分 ,以方便后期的 研究。目前分 的方法主要有人工分 、聚 算法等。
3 合肥市房地 特征价格模型构建
3.1 数据采集与 理
2021年5月,通 八爪 件在合肥市房天下网站上 行数据采集。在房天下在售或待开盘的新楼 中,按照分 抽 的方法,共爬取38个新楼 的在 9266条(表1)。之后将每个楼 的 数据 行 , 行数据 理工作。
表1 分 抽取合肥市楼 本
区 楼 数 抽取数 楼 名称
阳 27 2 、 ·
万科森林公园 碧桂园 代 城
瑶海 40 3 安建·翰林天筑、新力 园、 上街
球中心
蜀山 30 2 、
金隅南七里 桃源里
包河 43 3 恒大水晶国际广场、信达·天御、滨
湖·阳光里
政 7 1 蔚 商 港
高新 29 2 、 ·
太平洋森活广 祥源 金港湾
开 12 1 水安盛世桃源
新站 31 3 隆昊昊天园、圣 梦溪小 、禹洲中
央城
湖新 37 3 合肥融 文旅城/梧桐街、文一·豪
金地、国 中心
肥西 53 4 万瑞林山翠 、西南 城、光明·观
公 、 南城·紫 名都
肥 66 5 合肥孔雀城、盛世新城、星光国 广
场、 方明珠嘉苑、安建 花园
丰 58 4 新慧御湖城、恒泰阿奎利 ·悦璟府、
御景嘉苑、元一·后九
江 23 2 、
新力湖畔樾山 江美的城
巢湖 36 3 天巢广 、 源聚 湾、深 半 御
泉庄
3.3 模型
采用Word2vec工具中的Skip-gram 模型 行模型训练。首先使用inport指令调用gensim 库、Word2vec模型和os 具将 理后的名 及名 短 集合 成 向量。
完成后, 算候 和种子 中各个 之 的余弦相似度,并将相似度大的候 加入种子 中,形成 品特征 典。完成后 的相似度 算后, 有很大一部分与种子 相似度高的 并不能代表商品的属性或者特征,需要将其 理与剔除。如“交通” 个属性,与其相似度高的如“成熟、远、性价比、有点”, 然 于 些 ,需要 理与剔除,最终形成房地产产品特征词库(表2)。
3.4 合肥房地 特征 与分
由于最后得到的产品特征词库所含的单词数量已 小,本文主要采用了人工分 的方法 行 品特征分 。最 出“区位”“ 型”“装修”
“配套 施”“物 量”“ 化 境”“交通”“学区”共8个代表消 者 著偏好的房地 特征属性,见表2。
表2 房地 品特征
序号 品特征 房地 特征
1 地段位置市中心区内一 一 内 区位
空 三房阳台主卧室套型楼 距小 型
2 起居室窗 房主客主卧空 感朝南 型
墅游泳池 生 大 型厨房公
3 格美 大气 尚通 空 感精装 别 装修
墅设计
配套周 餐 公司超市便利医院公园
4 行万达广 物市 商圈卖场 影 配套 施
院逛街酒店花园商 广 物中心
5 物 管理 里 境干 清爽空气 境 物 量
美 美
6 化 野花草树木 风景 宜人 景观 园林 化 境
意
7 出行便利公交交通公交 公交 路公交 交通
站地 口
8 上学学校中学学区小学教育幼儿园 就 学区
近入学
3.2 种子 构建 4 研究
从清洗后的数据集中,随机抽取110条关于恒 4.1 特征 量的 取
大水晶国际广场的在线评论数据,人工进行标 依据前文 出“区位”“ 型”“装修”“生活配
注、 并与分类,并且按词频排序去除低 词和高 套 ”“ ”“ ”“ ”“ ”
物 量 化 境 交通 学区 共8个代
非特征 ,建立特征种子 。并以提取出的种 表消 者 著偏好的楼 特征来 行房地产特征
子 基准,通 哈工大同 林 种子 行 价格模型构建。
展 。 ) 。 区位特征表征的是一个地区经济和
1区位
223
科技和 第22卷 第11期
社会 展水平。本文采用楼 距本 区政府的直 本文主要 化率来表征。
距离来量化区位因素 。 ) 。 学区所占有的优质教育资源具有明
7 学区
) 。 , 的溢价效 。 ,
2 型 型的表征种 多 住宅的面 和 本文主要采用以小区 中心 半径
功能 数都是从不同的角度 房屋居住的舒适度 、 、 ,
为1km的范 内是否有幼儿园 小学 中学 每
行的 价 。 , , 。
由于一个楼 往往 有多种 型 本 计1分 共3分
文 取楼 的最大 型和最小 型分 行量化 。 ) 。 考 到合肥市第一条地铁线路已经
8 交通
) 。 , ,
3 装修 主要是指房屋的装修程度 通常分 于2016年开始运 本文主要采用楼 500m范
、 、 。 由于本次研究 内公交 路条数和楼 到最近地 站的直线距离
毛坯 装 精装和豪装4个等
象均 新楼 ,装修基本 毛坯房,故将“装修”特 来量化交通的便利性。
征 量剔除。 4.2 数据采集和量化
) 。 主要考察小区生活便利程度 。 通 八爪 爬虫软件在房天下平台对合肥市
4 生活配套
, 的范 2021年5月在售新楼 数据 行收集 。 由于本次
本文主要采用以小区 中心 半径 1km
、 、 、 , , , ,
内是否有超市 餐饮 医院 银行 每项计1分 共 研究 象均 新楼盘 楼 装修基本 毛坯房 故
4分 。 “ ” 。 “ ”“ ”“
将 装修 特征 量剔除 针对 区位 型 生
) 。 , 活配套 ”“ ”“ ”“ ”“ ”
5 物 量 一般来 物 越高 意味着 物业质量 绿化环境 交通 学区
, 。 本文主 7个房地 特征 取了9个特征 量 。 了保 数
物 量 小区的 境和管理也会越完善
要 物 来量化物 量。 据的真 性和准确性,将重复 本剔除并 极端
) 。 绿化率越高则意味着建筑密度 , 。
6 化 境 行了 尾 理 最 共收集148个楼 交易数据
, 。 。
越低 小区内 化等自然景 境条件就会更好 所有 量的 明与描述性 表3
表3 量的描述性
量 量化指 均 准差 最小 最大
住宅价格 / 13635.00 5064.00 6500.00 26752.00
楼 挂牌均价 元
住宅价格 数 楼 挂牌均价自然 数 9.46 0.36 8.78 10.19
区位 / 13.48 16.63 1.50 58.80
小区到本 区政府的直 距离 km
最大 型 2 146.61 67.98 53.00 423.00
楼 最大 型的面 /m
最小 型 2 91.31 24.82 38.00 217.00
楼 最小 型的面 /m
生活配套 、 、 、 , , 3.03 1.02 0 4
小区1km之内是否有超市 餐 医院 行 每 1分 共4分
物 2 1.91 0.70 0.60 4.30
住宅小区物 管理 /(元/月/m )
化率 住宅小区 化率 0.39 0.04 0.20 0.43
学区 、 、 , , 2.21 0.91 0 3
小区1km之内是否有幼儿园 小学 中学 每 1分 共3分
公交 路 小区500m之内公交 路条数 2.26 1.85 0 8
地 距离 / 11.16 16.79 0.10 52.00
小区到最近地 站的直 距离 km
4.3 回 果分析 , 。 ,
以看出 模型不存在异方差 因此 该模型基
特征价格模型常用的函数形式有 性、半 数 本 足了同方差性和独立性假 ,具有良好的 合
和全 数形式。 于模型函数形式的选择并没有 度和 高的解 能力。
一的 准 。 , , ,
基于国内外已有文献研究 半 数形 从回 果看出 在 著性10%的水平下 9个
、 、 , “ ”“
式在 量 位差异性 量化解 变量的影响 异方 量中有8个 入了模型 分 是 区位 最大户
[ ]
差最小化等方面 于 性形式和全 数形式 50-51 , 型”“最小 型”“生活配套”“物 ”“ 化率”“学
, ”“ ”。“ ” ,
因此本文主要采用Stata 件 行 研究 半 区 地 距离 公交 路 的 著性 0.3398
。 未通 著性 。 ,
数形式的回 果 表4 究其原因 公交 路越多的地
模型的调整后的 2 , 方,噪声 染可能越 重,在上下班高峰期也会造
R =0.5787 F-statics=
, 。 多重共 性 成交通堵塞 。 同 公交出行所花 的时间具有较
21.0618 整体的 合度 好
, , 、
果表明 所有 量的方差膨 因子VIF最大 高的不确定性 与地铁 私家 和共享 等存在
, , [52] ”
的替代性 , “
1.87 明解释变量之 相 独立 不存在严重的 故 公交 路 住宅价格的影响
多重共 性 。从White 和BP 果可 被弱化。因此基于用 关注的合肥市新楼盘特征
224
沁娜等:基于用 关注的房地 特征价格模型构建研究
价格模型
ln(住宅价格)=8.4952-0.0018(区位)+0.0011(最大 型)+0.0033(最小 型)+0.0201(生活配套)+0.1189(物 )+0.7197( 化率)+0.0475(学区)-
0.0099(地 距离)。
表4 模型回 果
被解 量: 系数 t值 P值 VIF
住宅价格 数
区位 *** -3.8413 0.0002 1.09
-0.0018
最大 型 0.0011 2.9862 0.0033 1.54
***
最小 型 0.0033 2.6026 0.0103 1.87
**
生活配套 0.0201 1.8892 0.0610 1.53
*
物 0.1189 3.4653 0.0007 1.45
***
化率 0.7197 4.0067 0.0001 1.32
***
学区 * 1.8513 0.0663 1.41
0.0475
公交 路 -0.0123 -0.9578 0.3398 1.41
地 距离 -0.0099 -6.7662 0 1.57
***
常数 8.4952 39.8731 0 —
***
本量 148
2 0.5787
整R
F-static 21.0618
( ) 0.3799
特 P值
( 值 ) 0.7859
BP检验 P
注:*、**、***分 表示在10%、5%、1%的水平下 著。
在保持其他特征不 的条件下,最大 型和最小 型面 的回 系数均 正数,楼 住宅价格会随着住宅面积的增加而增加。楼盘物业费、绿化率、生活配套和学区的回 系数也显著为正,说明小区物 量越高, 化 境越好,生活配套和教育配套越完善,楼 住宅价格也越高;区位和地铁距离的回 系数 著 表明楼 距离辖区政府和地 站越近,楼 住宅价格越高。从 学和常 的角度来看 些特征 量的回 系数符号均与 期相符, 明舒适的居住 境和便利的配套 施会更加受到 房者的青 , 住宅价格也有 著的增 作用。
5 与展望
的特征价格模型中,特征 量的 往往是参照其他学者的研究 和主 直接 定,缺少 范的 程,容易造成重要特征缺失或多重共 性等 ,从而影响模型的精确度,也不能反映 房者的真 偏好。本文利用基于同义 林与 向量的 品特征提取及 构建方法,通 挖掘房地 网 平台在 用 中 含的购房者情感 向,构建体 用 关注的房地 特征价格模型,并以合肥市148 新楼 数据 本 行
研究。 果 示, 模型能 合理地避免自 量的多重共 性,也能 合理 估房地 特征属性的 含价格,具有良好的拟合度和较高的解释能力。伴随着新消 势的延展以及新一代消 群体的崛起,可以 ,通 网 在 用 评论来表达自己的意 和 点将成 一种流行的方式。深度挖掘 些信息不 能 消 者购房决策和开 商建 足广大 房者需求的小区提供依据,也可以 政府 行公共 源 化配置提供决策参考。
参考文献
[] :
1 ROSENS.Hedonicpricesandimlicitmarketsp product
[]
differentiationinpurecompetitionJ.TheJournalofPo-
, , ():
liticalEconomy1974821 34-55.
[] ,
2 GOODMANCA.Hedonicpricespriceindicesandhous-
[] , ,():
ingmarketJ.JournalofUrbanEconomics197854
471-487.
[] ,
3 生 温海珍.房地 特征价格模型的理 展及其
用[] 外国 与管理, (): ,
J. 20045 42-4449.
[] , :
4 温海珍 生 .住宅的特征与特征的价格 基于特征价
[] ( ), ( ):
格模型的分析J .浙江大学学报 工学版 200410
,
101-105 112.
[] ,
5 文秀 徐健.基于用 的商品特征提取及特征价格
研究[]数据分析与知 , ,():
J. 201937 42-51.
[] , , ? 来自评论文
6 修箭 李旭升 萍. 房者关心什么
[ / ] :
本和房地 市 的 据 EBOL .北京 中国科技 文在
线[ ] :// /
2019-05-13.http www.paper.edu.cnreleasepa-
/ /
percontent201905-115.
[] , ,
7 夏火松 培 熊淦.基于特征提取改 的在 评论有效
性分 模型[]情 学 , , ():
J. 2015345 493-500.
[] , ,
8 邢云菲 曹高 陶然.网 用 在 的主题图谱构
: [] ,
建及可 化研究 以酒店用户评论为例 J .情报科学
, (): ,
2021399 101-109 116.
[] , []
9 王德 黄万枢.Hedonic住宅价格法及其 用J .城市
划, ():
20053 62-71.
[ ] BUTLERRV.Thespecificationofhedonicindexesfor
10
[] , , ():
urbanhousingJ.LandEconomy1982581 96-108
[ ] ,
11 SCOTTATHOMASD.ABayesianapproachtoassess-
[]
ingtherobustnessofhedonicpropertyJ.Journalof
, ,():
AppliedEconometrics198721 27-45.
[ ] , ,
12 程 李 昭 吴 .Hedonic住房价格模型的 与
实证检验 [] , , ( ):
J.系统工程理论与实践 20103011
1921-1930.
[13] CHRISG,DANIELG,ULRIKEG,etal.Pricinginthesharingeconomy:ahedonicpricingmodelappliedtoAirbnblistings[J].JournalofTravel&TourismMar-keting,2018,35:46-56
[14] 冬玲.杭州城市公共交通 住宅价格影响分析[D].杭
州:浙江大学,2019.
[15] 黄 .城市 道交通 周 房地 价格的影响:以郑
225
科技和 第22卷 第11期
州地 1号 例[J].洛阳 范学院学 ,2017,36(2):
75-81.
[16] 高禄, 光.成都市城市快速 道交通 住房价格影响[C]//20153rdInternationalConferenceonSocialScienceandHumanity(ICSSH2015),2015:123-128.
[17] WEIJF,WEIYG,JIANGK.Studyontheaffectingfac-torsofhousingpricesalongrailtransitbasedonhedonicpricemodel:casestudyofBeijingSubwayLine5[J].AppliedMechanicsandMaterials,2014,507:642-645.
[18] 梁青槐,孔令洋, 文斌.城市 道交通 沿 住宅价 影响定量 算实例研究[J].土木工程学报,2007(4):98-103.
[19] 荣宝, 美招.城市 道交通 沿 房价影响的定量分析:以广州地 五号线为例[J].当代旅游(学术版),2010(2):25-28.
[20] 于富 .城市 道交通 沿 房地 价 影响的 效
应[D].北京:北京交通大学,2012.
[21] HENRYMK,PATRICKPK.AhedonicpricemodelforprivatepropertiesinHongKong[J].TheJournalofRealEstateFinanceandEconomics,1995,10(1):37-48.
[22] 蒋忠珍,何景明.基于在 的高端 香型白酒消费特征分析:以 天茅台酒在京 上的在 例[J].中国 造,2021,40(10):235-238.
[23] 祝琳琳,李 ,李世 ,等.面向 子商务网站的在线评 信息 量感知机理研究[J/OL].图书情报工作:1-9[20220125].htts://doi.or/10.13266/.issn.0252
-- p g j -
3116.2021.06.004.
[24] 梁 ,田佳佳,刁建超,等.基于三 度理论的游客在线 分情感异质性及影响因素研究[J/OL].南开管理评论:1-29[2022-01-25].http://kns.cnki.net/kcms/de-tail/12.1288.F.20210810.1007.002.html.
[25] 甘子琴.基于在 挖掘的旅游 子商 服 量研究:以“携程旅行网” 例[J].中国集体 ,2021(13):71-73.
[26] 永 ,王哲平.网 口碑 票房表 的影响研究:基于人工神 网 的 影票房 [J]. 影文学,2021(21):3-14.
[27] 刘磊,柳旭 .外国 众 中国 影在 的文本分析:基于IMDb网站的 本 [J].当代 影,2020(3):144-149.
[28] 蒋乾,刘莎,唐宏,等.短租民宿在 论语义网络及感知 度研究:基于途家网和Airbnb的文本挖掘[J]. 源开 与市 ,2022,38(2):239-248.
[29] 史达,王乐乐,衣博文.在线评论有用性的深度数据挖掘:基于TripAdvisor的酒店 数据[J].南开管理评论,2020,23(5):64-75.
[30] 周立欣,林杰.基于 NodeRank算法的 品特征提取研究
[J].数据分析与知 ,2018,2(4):90-98.
[31] ZHOUS,QIAOZ,DUQ,etal.Measuringcustomeragilityfromonlinereviewsusingbigdatatextanalytics[J].JournalofManagementInformationSystem,2018,35(2):510-539.
[32] 丹萍,靳健,耿 ,等.感性工学 角下的用户需求挖
掘研究[J].情 学 ,2020,39(3):308-316.
[33] 邢云菲,曹高 ,陶然.网 用 在 的主 构建及可 化研究:以酒店用户评论为例[J].情报科学,2021(9):101-109.
[34] 严炜炜, 瑞,黄 .干 足否:知 直播产品特征提
取与 挖掘[J]. 情 知 ,2021,38(4):11.
[35] HUM,LIUB.Miningandsummarizingcustomerre-views[C]//ProceedingsoftheTenthACMSIGKDDIn-ternationalConferenceonKnowledgeDiscoveryandDataMining,2004:168-177.
[36] BLAIR-GOLDENSOHNS,HANNANK,MCDONALDR,etal.Buildingasentimentsummarizerforlocalservicereviews[C]//ProceedingsoftheWWW2008Workshop:NLPintheInformationExplosionEra(NLPIX2008),2008:200-207.
[37] 阮光册,夏磊.基于关 的文本主 深度挖掘应用
研究[J]. 代 情 技 ,2016(12):50-56.
[38] WUY,ZHANGQ,HUANGXJ,etal.Phrasedepend-encyparsingforopinionmining[C]//Proceedingsofthe2009ConferenceonEmpiricalMementalJointApproachtoWordSegmentation,POSTagging,andDependencyParsinginChinese,Proceedingsofthe50thAnnualMeetingoftheAssociationforComputationalLinguistics(Volume1:LongPapers),2012:1045-1053.
[39] 静,吴 ,魏从悦,等.基于句法依存卷积神经网络的
句子相似度 算[J].重 大学学 ,2020,43(9):41-53.[40] TITOVI,MCDONALDR.Modelingonlinereviewswithmulti-graintopicmodels[C]//Proceedingsofthe17thInternationalConferenceonWorldWideWeb,2008:111-
120.
[41] BOUAZIZA,DARTIGUES-PALLEZC,DACOSTAPC,etal.Shorttextclassificationusingsemanticrandomforest[C]//InternationalConferenceonDataWarehou-singandKnowledgeDiscovery.Springer,Cham,2014:288-299.
[42] 彭云.提取商品特征和情感 的 束 LDA模型研
究[D].南昌:江西 大学,2016.
[43] 彭云,万常 ,江 蛟,等.基于 束LDA的商品特
征和情感 提取[J]. 件学 ,2017,28(3):676-693.[44] 彭云,万常 ,江 蛟,等.基于 束LDA的商品特征和情感 提取[J]. 件学 ,2017,28(3):676-693.
[45] MIKOLOVT,SUTSKEVERI,CHENK,etal.Distribu-
tedrepresentationsofwordsandphrasesandtheircom-positionality[C]//AdvancesinNeuralInformationPro-cessingSystems,2013:3111-3119.
[46] 李 卿,王 .基于大 模 数据的 品特征词典构建方法研究[J].数据分析与知识发现,2018,2(1):41-50.
[47] 黄仁,张卫.基于 word2vec的互 网商品 情感 向
研究[J]. 算机科学,2016(S1):387.389.
[48] 可嘉, 晶晶,靳健,等.基于 和情景语义的产品
226
沁娜等:基于用 关注的房地 特征价格模型构建研究
[] ( ), , [ ] , , ,
特征提取方法J .广西大学学 自然科学版 202045 50 于 饶烨 胡志丁 等.北京都市区土地价格梯度估算
(): 与解析[]自然 源学 , , ():
6 1413-1422. J. 2013285 11.
[ ] , , [ ] , ,
49 SIRMANSGSMACPHERSONDAZIETZEN.The 51 董藩 丁宏 安平.通勤成本与 道交通周 房价的空
[] 分布:以北京地 五号 周 住宅市 例的 分析
compositionofhedonicpricingmodelsJ.JournalofRe-
, , (): []北京 范大学学 (社会科学版), ():
alEstateLiterature2005131 3-34. J. 20094 137-143.
ResearchonHousingHedonicPriceModelBasedonUserConcerns:
TakingHefeiCityasanexample
1,2, 1
ZHAOQinna LIHang
(1.SchoolofManagement,HefeiUniversityofTechnology,Hefei230009,China;
2.ResearchCenterofIndustrialTransferandInnovationDevelopment,HefeiUniversityofTechnology,Hefei230009,China)
Abstract:HedonicPriceModelisaclassicmodel,whichcommonlyusedinrealestateresearch.Itscharacteristicindexesareoftenselected
basedonresearchers’pastexperienceandpreference,whiletheemotionalpreferenceofhomebuyersisnotconsideredenough.Basedonthe
,
abundantonlineusercommentsontherealestatenetworkplatformtheimplicitemotionalpreferenceofhomebuyersisexploredandthechar-
’ ,
acteristicpricemodelofrealestatethatreflectsusersconcernsisestablished.TakingHefeiCityasanexample148groupsofrealestatedata
arecolectedforemiricalresearch.Theresultsshowthatp “ ”“ ”“ ”“ ”“ ”
location housetype decoration supportingfacilities proertpyquality
“ ”“ ” “ ” ’
greenenvironment trafficandschooldistrictarethecharacteristicsofrealestatebuersy sinificantgpreferences.Andthehedonicprice
modelconsistedofthesecharacteristicscanreasonablyevaluatetheimpliedpriceofproductcharacteristicsandhasgoodgoodnessoffitandhighexplanatoryability.
: ; ;
Keywordsonlinereviewscommoditycharacteristicshedonicpricemodel |