1、选题依据及意义(不少于300字)。
1)选题依据。
将这些新的数据库算法集成到大多数数据库系统中是非常困难的。 目前,大多数数据库系统,如MySOL,Oracle,Microsoft SOL Server,其功能扩展性都不好,如果要在这些数据库系统中添加新的算法,往往需要修改这些系统的源代码,无论是开发门槛还是开发周期都非常高。 这阻碍了新的数据库算法,特别是基于人工智能的数据库算法在数据库系统中的应用。 除了修改系统源代码外,通过模拟数据库的相关行为和操作来实现新的数据库算法也是一种常用的方法。 该方法虽然大大降低了工作量和开发门槛,但仅停留在仿真环境中,无法在真实系统中测试算法的性能,产业价值不高。 新的索引算法拟合树算法是在模拟数据库环境中进行的性能测试,但该算法没有考虑与实际数据库系统的兼容性问题,例如数据的物理位置不是单个值。
解决这个问题的最好方法是通过开发扩展将新算法集成到数据库系统中。 这种方法非常灵活,大大减少了工作量和开发工作量,但目前可扩展的系统并不多。 与其他数据库系统相比,开源数据库系统PostgreSQL具有非常好的扩展性。 PostgreSQL 在设计时考虑了可扩展性,因此与其他数据库相比,它非常灵活。 PostgreSQL通过扩展接口将新算法扩展到数据库,运行时就像PostgreSQL的现有功能一样。 但是,postgresql的扩展接口并不完善,使用postgresql扩展开发接口对开发人员来说门槛很高,尤其是对于学术工作者来说,开发人员首先需要做的就是熟悉postgresql的底层实现,因此扩展的开发通常需要很长时间才能完成。
2)研究意义。
如今,人工智能技术如火如荼,因其强大的学习、推理、规划能力,被广泛应用于各个领域。 在数据库领域,人工智能技术不仅具有非常广阔的应用前景,也为数据库系统提供了新的发展机遇。 近年来,涌现出许多基于人工智能技术的新型数据库算法,通过建模和学习数据分布、查询负载、性能等特点,自动执行查询加载、参数调优、数据分区、索引维护、查询优化等操作,不仅提高了数据库相关算法的性能,还减轻了数据库运维人员的工作量, 这对数据库技术的发展具有重要意义。
为促进人工智能技术在数据库领域的应用和发展,本文拟开发基于开源数据库PostgreSQL Visual Dock Station(以下简称VDS)的系统。 该系统为索引算法和扫描算法提供了易于使用的扩展界面,以及扩展的可视化管理、配置和安装此外,为了方便研究人员对算法进行调整和测试,系统提供了查询计划可视化功能。 系统一方面有利于研究人员在实际系统中快速测试和应用算法,另一方面也可以协助研究人员对算法进行优化,这对许多数据库算法的研究具有重要意义。 最后,该文使用新的扩展接口实现拟合树算法,提高了算法的工业价值,丰富了PostgreSQL系统的功能特性。
2、研究目标及主要内容(含**(设计)提纲,不少于500字)。
1)研究目标。
人工智能技术在数据库领域的发展前景非常广阔,但阻碍人工智能技术在数据库领域应用的障碍是在实际数据库系统中扩展新算法的门槛高、工作量大,因此本文的主要研究内容是降低新算法在实际数据库系统中的集成难度。 考虑到现有工作的利弊,本文计划通过扩展开发一种新的数据库算法,以降低将新算法集成到数据库系统中的难度。
2)主要内容。
本文将分为六章。 第一章是引言,介绍了本文的研究背景和主要工作。 第2章是VDS系统的需求分析。 第三章是VDS的架构设计,主要内容是设计系统的架构,介绍各子系统的功能。 第四章是关键技术与实现,本章详细介绍了VDS系统实现的关键技术,以及具体的技术方案。 第五章是系统实现和运行测试,主要描述系统的实现,论证系统满足功能、性能、安全性等设计要求。 第六章是总结,总结了全文,提出了当前系统研究的前景和不足。
3.研究方法和手段。
第 1 章引言。
第 2 章 系统要求设计。
2.1 系统要求说明。
2.2、系统功能需求分析。
2.3.分析系统的非功能性需求。
第 3 章 系统架构设计。
3.1、整体结构设计。
3.2、系统功能设计。
3.2.1. 扩展开发模块设计。
3.2.2.扩展管理模块设计。
3.2.3.扩展测试模块设计。
3.2.4.查询可视化模块的设计。
第4章:关键技术与实现。
4.1 系统的一般技术概述。
4.2 实现扩展开发功能。
4.3.扩大管理职能的实施。
4.4 扩展测试功能的实现。
4.5 查询可视化实现。
4.6 fiting-tree 索引扩展实现。
第 5 章系统实施和操作测试。
结论。 引用。
参考书目(作者、书名或书名、出版商或刊号、出版日期或刊号)。
1] 孙路明, 张少民, 姬涛, 李翠萍, 陈红. "人工智能赋能的数据管理技术研究。
探讨。 "软件学报,2020,31(3):600-619
2] galakatos,alex,et al. "fiting-tree:a data-aware index
structure." proceedings of the 2019 international conference on management of data. 2019.
3] zhou, wensheng, and xiaojun ye. "implementation of aries
algorithms in postgresql." computer engineering 1(2006): 24. [4] vengerov, d**id, et al. "join size estimation subject to filter conditions."proceedings of the vldb endowment 8.12(2015):1530-1541.
5] Zhang等. "用于内存计算的连接算法。 "华东师范大学学报(自然科学版).
6] barthels, claude, et al. "distributed join algorithms on
thousands of cores."proceedings of the vldb endowment 10.5 (2017): 517-528.
7] chakraborty,sanjay,n.k.nagwani,and lopamudra dey.
performance comparison of incremental k-means and incremental dbscan algorithms." arxiv preprint arxiv:1406.4751(2014).
8] golshanara,ladan,seyed mohammad taghi rouhani rankoohi,and hamed shah-hosseini."a multi-colony ant algorithm for optimizing join queries in distributed database systems."knowledge and information systems 39.1 (2014): 175-206.
9] ngo h q. worst-case optimal join algorithms: techniques,results, and open problems[j]. proceedings of the acm sigact-sigmod-sigart symposium on principles of database systems, 2018:111-124. doi:10.1145/3196959.3196990.
10] ngo, hung q. "worst-case optimal join algorithms: techniques, results, and open problems."proceedings of the 37th acm sigmod-sigact-sigai symposium on principles of database systems. 2018.
11] 范燮宇, 任英超."开源关系型数据库集群的并行空间连接算法实现。 "计算。
机器系统应用025010(2016):233-239.
12] fahad, adil, et al. "a survey of clustering algorithms for big
data: taxonomy and empirical analysis." ieee transactions on emerging topics in computing 2.3(2014):267-279.
13] velmurugan t. performance based analysis between k-means and
fuzzy c-means clustering algorithms for connection oriented telecommunication data[j]. applied soft computing, 2014, 19:134-146.
14] giles, d**id m., et al. "advancements in the aerosol robotic network (aeronet) version 3 database- automated near-real-time quality control algorithm with improved cloud screening for sun photometer aerosol optical depth(aod)measurements. atmospheric measurement techniques 12.1(2019).
15]邵斌,徐国胜."DLB+ Tree:一种基于双叶节点的内存数据库索引算法。 "
中国通信学会第十届学术年会,2014
16]张岩松,张宇,王山."一种新的基于向量索引的内存中 OLAP 星型连接加速。
科技。 "计算机学报 8(2019): 2