设计文档
毕设所解决问题
诸多文献数据库格式的统一和互相之间的自动转化
实现PDF,Office等文字处理软件的自动提取参考文献的功能
实现相应的数据库管理功能和GUI
整体设计思路
调查各文献数据库格式,整合主要文献数据库的标准格式
通过BibTex作为各个文献数据库格式间转化的中间格式并对其进行设计使得标准文献数据库格式之间的转化从一个N:M的形式转换成1:N的形式.
有关论文范文主题研究: | 关于数据库的论文范文集 | 大学生适用: | 学术论文、学年论文 |
---|---|---|---|
相关参考文献下载数量: | 42 | 写作解决问题: | 如何怎么撰写 |
毕业论文开题报告: | 标准论文格式、论文摘要 | 职称论文适用: | 职称评定、职称评中级 |
所属大学生专业类别: | 如何怎么撰写 | 论文题目推荐度: | 最新题目 |
即:标准的各类文献数据库格式——>,BibTex——>,转化成其他标准文献数据库格式.又由于文献数据的特殊性,即其本身又可分为论文,着作,书籍,会议等诸多种类,因此在标准的各类文献数据库格式转化成为BibTex的时候实际上是转化成为一种标准的文献类型(即Bibliography entries),而这种文献类型在数据库中的表现即为一种按文献类别分类的数据表格.据此,上面的2段转化模式应该更改为:
标准的各类文献数据库格式——>,转化成为14中标准的文献类型之一,即转化为某种表格数据——>,提取成为包括BibTex在内的某种既定合适的格式.
通过PDFbox等相关的提取工具对PDF和Office等文字处理软件进行提取
具体步骤:1)定位提取的内容
2)使用工具进行相关提取
3)判断属于哪种文献数据库格式
4)通过2中所述的2段转化模式进行转化
作为整个文献管理系统的一部分,该GUI所承载的功能如下:
1)显示每个已收录的标准文献数据库格式
2)对输入的某个或者某些文献数据库格式进行判定,分别确定其属于某个已经 收录的文献数据库格式标准,并给出反馈
3)对于用户给出的文献数据库格式转化要求,只要在已收录范围内的都能转换
4)从PDF和Office中提取文献数据部分,并能对提取的部分实现1),2),3) 中所示的功能
其GUI简图见PDF
BibTex的标准格式
BibTex x
@article{ 10.1109/TC.2001.970573,
author 等于 {D. Lee and J. Choi and J.H. Kim and S.H. Noh and S.L. Min and Y. Cho and C.S. Kim},
title 等于 {LRFU: A Spectrum of Policies that Subsumes the Least Recently Used and Least Frequently Used Policies},
journal 等于{IEEE Transactions on Computers},
volume 等于 {50},
number 等于 {12},
issn 等于 {0018-9340},
year 等于 {2001},
pages 等于 {1352-1361},
doi 等于 {doi.ieeeputersociety./10.1109/TC.2001.970573},
publisher 等于 {IEEE Computer Society},
address 等于 {Los Alamitos, CA, USA},
}
BibTex的文献类型
article entry
book entry
booklet entry
conference entry
inbook entry
incollection entry
inproceedings entry
manual entry
mastersthesis entry
misc entry
phdthesis entry
proceedings entry
techreport entry
unpublished entry
数据库模式中应该包含的14中表格模式
article entry
AtrIDTitleJournalYearVolumeNumberPagesMonthNoteKID
book entry
AtrIDTitlePublisherYearVolumeSeriesAddressEditionMouthNoteKIDbooklet entry
TitleAtrIDHowpublishedAddressMouthYearNoteKID
conference entry
AtrIDTitleBookTitleYearEdIDPagesOrganizationPublisherAddressMouthNoteKID`inbook entry
AtrIDTitlechapterPublisherYearVolumeSeriesAddressEditionMouthNoteKID`incollection entry
AtrIDTitleBookTitleYearEdIDPagesOrganizationPublisherAddressMouthNoteKID`inproceedings entry
AtrIDTitleBookTitleYearEdIDPagesOrganizationPublisherAddressMouthNoteKID`manual entry
TitleAtrIDOrganizationAddressEditionMouthYearNoteKIDmastersthesis entry
AtrIDTitleSchoolYearAddressMouthNoteKID
misc entry
AtrIDTitleHowpublishedMouthYearNoteKID
phdthesis entry
AtrIDTitleSchoolYearAddressMouthNoteKID
proceedings entry
TitleYearEdIDPublisherOrganizationAddressMouthNoteKID
techreport entry
AtrIDTitleInstitutionYearTypeNumberAddressMouthNoteKID`unpublished entry
AtrIDTitleNoteMouthYearKID
以上诸表格的AtrID,EdID,KID三项需另有
AtrIDAuthorName
EdIDEditorName
KIDKey
依据BibTex做出的数据库表格设计
Table1
CKeyAuthorIDTNameJournal VL Issue Year Pages DoiPublisher AddressKeyWIDTable2
AuthorIDAuthorName
Table3
KeyWIDKeyW
收录的文献数据库格式
中华人民共和国国标
AuthorIDBNameKdOtherArs EditionPublishPPublisheryrNo EditorIDannotation 1)专着
AuthorIDAuthorName
OtherArsOtherArsName
EditorIDEditorName
2)连续出版物
PNameAuthorIDEditionVLPublishPPublisheryr EditorIDannotation
AuthorIDAuthorName
EditorIDEditorName
3)专利文献
AuthorIDTitleOtherArsannotationKdCountyPatentKd PatentNoDate
AuthorIDAuthorName
OtherArsOtherArsName
4)专着中析出的文献
【不清楚Citation_key是否必要,在下面的表中都没有注明了...不太清楚Citation_key是不是对任何类型的文献数据库格式都适用(为了防止数量多的时候的重复情况发生,而且是按一定方式自动生成了,所以列表的时候可以不列出来)】
AuthorIDTitleOtherArsOriginalAIDOriginalTitleEditionPublishPPublisheryrPlace
AuthorIDAuthorName
OtherArsOtherArsName
OriginalAIDOriginalAuthorName
5)连续出版物中析出的文献
AuthorIDTitleOtherArsOriginalTitleEditionPublishPPlace
AuthorIDAuthorName
OtherArsOtherArsName
OriginalAIDOriginalAuthorNameVLDB会议(AuthorID需另建表同上所示)
会议论文格式
AuthorIDTitleConferenceNamePagesYear
期刊格式
AuthorIDTitleJournalName VolPagesYear
AuthorIDTitleBName EditionPublishPPublisherYear书的格式
技术报告格式
AuthorIDTitleReportNo InstitutionPagesYear
SIGMOD会议
软件学报
1)期刊
AuthorIDTitleJournalName YearVolPages
2)会议
AuthorIDTitleConferenceNameYearPages