很久以前,我们发布了(上市公司数据资产指数测度数据2007-2022)。 现,为了进一步丰富成员组的研究内容。 我们再次添加了它2001-2024年上市公司数据资产信息披露等级预估数据!。使数据资产研究内容更加丰富、完整。
数据说明:由于数据资产尚未纳入资产负债表,其信息披露仍是自愿的。 因此,可以通过挖掘上市公司年报中的数据资产信息来评估数据资产信息披露的程度。
具体步骤如下;
第。 1. 使用“数据资产”作为助记词。
第。 2、借鉴中国信息通信研究院2024年发布的“数据资产是能带来经济效益的数据资源”的观点,也以“数据资源”为助记词。
第。 3.根据“数据资产”和“数据资源”两个种子词,借助word2vec神经网络模型,借助深度学习技术得到种子词的相似词集,为了提高测量的准确率,只保留相似度较高(大于等于0)的词5)、完成字典构建。
第。 四是挖出年度财务报告中种子词和类似词的词频,计算数据资产信息披露水平,计算公式如下。
datait=σdictionarywordsitn/totalwordsit×10
哪里;01:datait(表示数据资产的信息泄露级别)。 02:词典词典(**i年T年度财报中字典中第n个种子或类似词词的确切词频)。 03:TotalWordsit(**i在t年年报的总字频)。
此外,由于数据资产信息披露水平的变量是右偏分布,因此有必要进行该指标的执行对数处理(+1 对数)。。再归一化[0,1]。。最后,得到能够衡量上市公司数据资产信息披露水平的指标。
共挖掘上市公司文本68724篇,包括年报、社会责任报告、ESG报告、可持续发展报告、环境报告等。
其中:文本总数(68,724)=年度报告(56,176)+社会责任报告、ESG报告、可持续发展报告、环境报告和其他文本(12,548)。数据预览
数据检索和 **
可以通过加入数据成员数据库来获取(同时也可以**更多其他海量优质数据杜娘。