医学信息学的发展与思考

本站业务

在线期刊

访问统计

访问总数：34205 人次

本刊论文

医学信息学的发展与思考

作者：代涛时间：2016/09/25 点击：571

　　〔摘要〕医学信息学作为一门新兴的交叉学科，在过去几十年中得到了快速发展，学科内涵日益丰富，研究领域不断拓展。本文简要介绍医学信息学的内涵，回顾国内外医学信息学的发展历程，分析医学信息学研究的热点问题，并对我国医学信息学的发展进行思考，期望引起进一步的研讨，以共同推动我国医学信息学学科的发展。
　　〔关键词〕医学信息学；学科特性；研究领域；学科发展
　　医学信息学（MedicalInformatics)的研究和实践最早起源于20世纪50年代，但是作为一门学科则是于20世纪70年代才被正式提出。近20年来，伴随计算机、网络和信息技术的快速发展，医学信息学的学科内涵日益丰富，研究领域日趋广泛，形成了大量有价值的研究成果，新的研究热点不断出现。与先进国家相比，我国医学信息学学科发展还比较落后，主要表现为学科认识不尽统一、研究领域较为分散、理论基础较为薄弱等，难以满足我国医学科技和医药卫生事业发展的需求。鉴于此，对目前国际上医学信息学的发展现状进行较为系统的梳理，在此基础上探讨我国医学信息学的发展之路，具有重要的现实意义。
　　1医学信息学的定义与内涵
　　随着信息技术的快速发展，医学信息学的研究内容不断衍生和变化，学科内涵也在不断深化，并逐渐拓展到新的领域。尽管医学信息学作为一门学科的地位已获得公认[1)，但出于对学科内涵和外延的不同理解，迄今为止，尚未形成一个广泛认可的医学信息学学科定义U)。
　　1.1国外相关定义与内涵
　　通过对“医学信息学”术语的简单拆分，“医学”表明其研究和应用领域，“信息学”为方法论[3)。然而，“医学”和“信息学”均代表了非常广义的范畴，因此自产生以来，不同的机构和学者分别就各自的研究产生了不同的理解，如美国医学
　　信息学会(AmericanMedicalInformaticsAssociation,AMIA)的教育委员会认为医学信息学是“研究信息管理和信息科学在生物医学和医疗保健中应用的学科”W;英国医学信息学会（BritishMedicalInformaticsSociety)指出医学信息学研究通过对概念的理解、运用一定的技能和方法促进信息的使用和共享，提供卫生保健服务，改进人们的健康水平[5);德国医学信息学、生物计量和流行病学协会（Ger-manAssociationforMedicalInformatics,BiometryandEpidemiology)认为医学信息学是利用现代信息技术服务于卫生保健的各个方面[6]。一些专家学者也从不同方面给出了医学信息学的定义，如美国伊利诺伊大学香槟校区病理与医学信息学系教授AllanH.Levy认为“医学信息学是处理医疗保健过程中与信息相关的问题，包括获取、分析、处理和传播”[7];美国加利福尼亚大学医学信息学系教授M.S.Blois和德克萨斯大学健康科学中心生物医学信息学院教授、现任AMIA主席E.H.Shortliffe认为“医学信息学是对支持问题解决和决策制定的医学信息、数据和知识进行存储、检索和最优使用的学科”[8];上述理解和定义侧重于具体的应用过程和方法。但也有学者则认为医学信息学应有更广泛的内涵，如美国凯撒医疗机构研究部原主任、AMIA的发起人MorrisF.Collen在国际信息处理协会（InternationalFederationforInformationProcessing,IFIP)举办的第3次国际医学信息学大会（WorldConferenceonMedicalInformatics，MEDINF0)上将医学信息学定义为“医学信息学就是计算机技术在所有医学领域中的应用，包括医疗保健、医学教学以及医学研究”〔9〕。
　　1.2对医学信息学的定义
　　以上定义都从不同方面反映了医学信息学的内涵和外延，综合上述分析，我们认为，医学信息学就是通过计算机及相关信息技术来处理诸如生物医
　　学数据、信息和知识的存储、组织、检索和优化利用等一系列医学信息管理任务，以此来辅助医学领域的科研与实践，提高解决问题和制定决策的准确性、及时性和可靠性。也就是说，医学信息学处理的对象是生物学的、医学的甚至是更为广义的健康数据、信息和知识；处理过程包括采集、存储、组织、交互和展现等步骤；方法为引入数学、计算机科学、数据库和知识库、人工智能、统计学、语言学理论以及各种通讯技术来优化处理过程；最终目的则是改进患者健康水平，辅助决策，解决医疗及卫生信息化过程中的实际问题。具体来看，医学信息学研究的范畴包括医学知识表达、卫生信息系统、生物信息学、与之相关的社会和法律问题等4个方面。医学知识表达主要包括编码/分类和术语、计算机化的临床指南、决策支持、信息检索等；卫生信息系统主要包括医院信息系统、图形/图像系统、电子病历、远程医疗等；生物信息学包括信号处理、微阵列分析等；社会和法律问题主要包括成果评价、教育和培训等。
　　此外，医学信息学的交叉学科特性也更加明显，除了与计算机科学、情报学有交叉以外，还涉及到其他许多学科领域，如管理学、生物医学工程、分子生物学、数学等。这些学科领域与医学信息学共享知识、方法和技术。
　　2国内外医学信息学的发展
　　生物医学研究者于20世纪50年代开始使用电子数字计算机处理数字型数据，医学信息学最早期的研究成果可以追溯到1959年Ledley和Lusted在Science杂志上发表的“通过符号逻辑、概率和价值理论的推理辅助临床医生进行诊断”一文U2]。20世纪60年代，美国国立医学图书馆（NationalLibraryofMedicine,NLM)开始利用计算机处理文献数据。20世纪70年代初期，在IFIP上第1次出现“医学信息学”一词，是科学、工程和技术革新的有机结合；20世纪70年代末期，在第3次MED-INF0上首次规范了医学信息学学科名称，取代了早期的计算机医学医学信息处理、医学信息系统以医学信息学杂志2011年第32卷第6期
　　及医学信息科学等名词[9]。20世纪80年代，随着计算机、互联网的介人，医院信息系统得到了迅速发展和广泛运用。20世纪90年代医学信息服务内容更加丰富，NLM于1996年推出了面向全球用户并提供免费检索的PubMed系统；同期，人类基因组计划的实施也取得了一定成效，医学信息处理的数据类型呈现多样化、爆炸性的增长趋势。本世纪以来医学信息学研究范围不断扩大，应用领域不断拓展，形成了日趋成熟的学科体系，并建立了较为完善的教育和培训机制。下面从医学信息学的主要研究内容和领域进行简要介绍。
　　2.1医学知识表达
　　医学知识表达是指通过收集医学知识，对其进行系统和正式的定义，来保证人和计算机对医学知识的一致性理解，目前已广泛用于医学人工智能和专家系统中[13]。医学知识表达主要包括医学知识组织系统、医学数据编码和信息标准、医学信息检索、医学决策支持等。
　　2.1.1医学知识组织系统医学知识组织系统是实现医学知识组织与知识服务的重要支撑工具。最早的知识组织研究始于19世纪末第1版《杜威十进制分类法》（DeweyDecimalClassification，DDC)的问世，标志着知识组织研究的开始。随着医学的迅速发展以及医学信息资源的迅速膨胀，对医学领域信息资源的组织显得越发重要，20世纪60-80年代，医学知识组织的发展主要表现为主题词表和分类表的建设，其中较为权威的有美国《国立医学图书馆分类法》（NationalLibraryofMedicineClassification)和《医学主题词表》(MedicalSubjectHeadings,MeSH)，中国医学科学院医学信息研究所在MeSH的基础上，进行了扩展研究，推出了《英汉对照医学主题词注释字顺表》（ChineseMedicalSubjectHeadings,CMeSH)。20世纪90年代《中医药学主题词表》、《中图法医学专业分类表》相继问世，为推动我国医学知识组织系统研究起到了积极的作用。
　　为了实现不同知识组织系统之间的融合发展，1986年美国国立医学图书馆开展了一体化医学语言系统（UnifiedMedicalLanguageSystem,UMLS)的研制工作。在国内，2001年，中国中医科学院中医药信息研究所联合多家单位，依照中医药学特点及学科体系，研制开发了中医药一体化语言系统(TraditionalChineseMedicalLanguageSystem,TC-MLS)〇
　　生物医学领域本体是生物医学领域内概念模型的明确形式化规范说明。国外已经开展了一系列的生物医学领域本体研究项目，如基因本体（GeneOntology，GO)项目始于1998年，其目的是协助解决各数据库中对基因产物描述不一致的问题，它主要包括生物过程、分子功能和细胞组件3个分支〔15〕。此外，如欧盟的GALEN(GeneralizedArchi-tectureforLanguages,EncyclopediasandNomencla-tures)项目n6]和美国病理学家协会（CollegeofA-mericanPathologists，CAP)的SNOMEDCT(SystematizedNomenclatureofMedicine-ClinicalTerms)
　　项目[17)都在生物医学本体领域进行了探索和实践。在我国，国家知识基础设施（NationalKnowledgeInfrastructure,IVKI)也构建了其医学知识库（NKIMed),形成医学本体体系[18)。虽然医学知识本体得到了较快的发展，正在成为研究热点，但是由于概念揭示的复杂性，目前仍是知识组织领域的难点。
　　2.1.2医学数据编码和信息标准医学数据编码和信息标准旨在从语法和语义层面规范医学信息中的数值、文本、图像等各种内容的表达和使用，解决数据共享困难和系统之间难以交互的瓶颈问题。国外卫生信息标准化开始较早，其中HealthLevelSeven(HL7)是基于国际标准化组织所公布的网络开放系统互连模型第7层的医学信息交换协议[19],1987年发布了1.0版本，经过20年的发展，HL7发展到了极具创新性的3.0版本。为了方便图像数据和诊断信息在不同医疗系统中进行传输，1983年美国放射协会和美国国家电子制造协会制定了一套医学图像通信标准（DigitalImagingandCommunicationsinMedicine,DIC0M)〔2fl〕。此外，还产生了多种卫生分类标准，如在疾病分类方面，为了实现对医院疾病、死亡原因进行统计，创建了国际疾病分类法（InternationalClassificationofDisease,ICD)[2I];为适应基层医疗特点，开发了基层医疗国际分类体系（InternationalClassificationofPrimaryCare,ICPC);为规范临床术语，形成了便于计算机处理的医学术语系统SNOMEDCT。
　　国内的卫生信息标准化始于1995年卫生部开展的国家医疗卫生事业产业工程（金卫工程）。2000年1月1日我国成为HL7组织的成员国，并成立了HL7中国筹委会，2002年8月卫生部推出《病历书写基本规范》。2006年4月共同发起成立卫生部电子病历委员会（ChinaEHRSteeringCommittee)，其使命是促进电子病历在中国医疗卫生系统中的应用，以达到基于开放工业标准对患者的长期、完整健康记录进行交换和存取的目的。2009年推出《电子病历基本架构与数据标准》，以更好满足区域范围医疗卫生机构之间的临床信息交换和共享需要，实现以电子健康档案和电子病历为基础的区域卫生协同。
　　2.1.3医学信息检索和数字图书馆医学信息检索最早的研究可以追溯到1879年美国国立医学图书馆编译出版的医学文献检索刊物《医学索引》(IndexMedicus，IM)。1966年NLM将《医学索引》数字化，建立了MEDLARS(MedicalLiteratureAnalysisandRetrievalSystem)，1971年推出联机检索工具MEDLINE(MEDLARSOnline)，MED-LARS开展国际联机检索服务。19%年，NLM推出了PubMed，通过网络途径免费提供包括MEDLINE在内的自1950年以来、全世界70多个国家4300多种主要生物医学文献的书目索引和摘要，并提供部分免费和付费全文链接服务[22)。在我国，1994年中国医学科学院医学信息研究所推出了国内医学信息检索领域第1张数据库光盘——中国生物医学文献数据库（ChineseBiologicalMedicineonDisc,CBM);2008年中国医学科学院医学信息研究所推出了面向用户的自建资源整合平台SinoMed,在原有CBM的基础上增加了西文生物医学期刊数据以及北京协和医学院博硕士学位论文数据库等内容，在功能上做到集成化和个性化。随着多媒体出版和大规模化学分子结构库的出现，生物医学信息检索
　　JOURNALOFMEDICALINFORMATICS2011,Vol.32,No.6
　　的范围得到了很大的拓展，例如制图材料、基因、蛋白序列、音视频剪辑、图像及其他与生物医学研究、教育和病人保健有关的数字资源。数字人体将人体结构数字化和可视化，为生命科学研究提供了新的信息获取手段，1989年，美国国立图书馆开展了可视人计划（VisibleHumanProject,VHP),开始建立可供读者检索查阅的人体结构的图像资料库U3]。此外，1994-1995年，科罗拉多大学完成了男女两组可视人计划图像数据集[24]。2000年亚洲大学和韩国科技信息研究所报道了断层距离为0.2mm的可视韩国人（VisibleKoreanHuman，VKH)[25]。我国第三军医大学和第一军医大学自2002年构建中国人的男、女首批数据集开始，先后推出了8套能代表中华民族特色的数据集
　　狭义的数字图书馆指传统图书馆在网络环境下的延伸和发展，而广义的数字图书馆是Web信息环境向未来的演进[27)，其目的是为了解决海量、分布和动态的数字化资源的有效管理和利用，主要研究内容包括数字内容的开放存取、数字图书馆之间的互操作和跨数字图书馆的检索、知识产权以及数字资源的长期保存等问题。]990年美国国家自然科学基金（NationalScienceFoundation，NSF)发起了美国国家数字图书馆项目——美利坚记忆。我国1991年开始引进数字图书馆理论，1997年启动了“中国实验型数字式图书馆”项目，标志着我国数字图书馆事业进人实践阶段，2002年启动了“国家数字图书馆工程”。医学数字图书馆的建设有利于生物医学知识的共享与传播，将物理位置分散的文本、图像、影像等生物医学信息资源以数字化、网络化方式存储与互联，提供信息服务。
　　2.1.4医学决策支持医学决策支持就是通过计算机为临床治疗方案、医学处置和公共卫生政策等提供辅助决策的过程，一般包括临床决策支持和卫生决策支持。
　　临床决策支持主要研究应用计算机辅助临床决策支持问题，涉及到临床医生做出诊断和选择合适的治疗方法两个方面。临床决策支持系统是根据病人数据和医学知识，生成针对具体病例建议的知识系统。20世纪70年代，斯坦福大学研发了
　　专家系统，使用600个规则知识库和一些简单的推理方法用于支持临床决策咨询。从20世纪80年代起，数据挖掘的功能被集成在一些医学信息系统中。例如，犹他州大学LatterDaySaints医院开发的HELP系统在传统医疗记录功能的基础上提供了监测功能[28]，SAPHIRE系统利用UMLS词表提供了放射报告自动索引功能。在我国，1975-1979年，北京中医医院与中国科学院自动化研究所、首都医科大学合作研究编制出对肝炎的辨证论治诊疗经验的电子计算机程序，是我国最早基于中医理论的临床决策支持系统[3°]。20世纪80年代以来国内涌现了一批专科临床决策支持系统，如肝病营养疗法专家系统、昏迷诊断计算机专家系统、急性肾衰诊断系统以及疾病诊疗用药系统等。2003年，易涛等人研制的“心血管药物治疗专家系统”，采用了案例推理方式，解决临床医生获得用药经验和知识的问题[31]。
　　卫生决策支持是为了对卫生管理活动过程中产生的知识进行深度挖掘，提供更加科学、定量的政策分析模式，有效解决制定战略决策及发展规划中的复杂问题，实现对既定政策的量化指标评估及效果预测，提高决策科学化水平。“卫军一号”军队卫生信息资源配置决策支持系统[32)、非典防治决策支持系统[33]、卫生检验检疫决策支持系统[34]以及由中国医学科学院医学信息研究所正在研发的卫生政策研究决策支持系统等，都为卫生决策支持系统的建设提供了有益借鉴。
　　2.2卫生信息系统
　　卫生信息系统起步于纸质内容的计算机处理，从支持管理人员和专业人员转变为面向患者为中心，以技术为中心转变为管理和决策服务，以机构部门管理为中心转变为区域化和全球化的协作。利用卫生信息系统改进卫生保健的质量，降低医疗成本，已成为各国医疗卫生服务体系变革的主要内容。2000年，欧盟行动计划e-Europe将电子医疗作为重点发展的公共服务；2001年，日本政府重新修订“日本电子战略”，强调了包括医疗在内的IT7大应用领域；2006年，韩国政府制定了“电子韩国2006计划”，重点发展数字医疗；2009年，美国总统奥巴马当选后就宣布实施健康信息化计划；2009年4月，我国在中共中央、国务院颁布的《关于深化医药卫生体制改革的指导意见》中，将卫生信息化作为深化医药卫生体制改革的重要任务之一〔35〕。
　　2.2.1医院信息系统目前学术界比较公认的医院信息系统（HospitalInformationSystem,HIS)是由MorrisF.Collen教授于1968年所给的定义：利用电子计算机和通讯设备，为医院所属各部门提供病人保健信息和行政管理信息的收集、存储、处理、检索和数据交换的能力，并满足所有授权用户的功能需求〔36-37〕。
　　医院信息系统在国外许多发达国家已有近50年的开发利用历史，产生了一系列成功案例[38)，尤其是美国在医院信息化建设方面经验丰富。著名的麻省总医院开发的COSTAR系统是20世纪60年代初开始，并发展到今天成为大规模的临床病人信息系统[39];20世纪70年代起，医院信息系统进人大发展时期，美国的大学医院及医学中心纷纷开发医院信息系统，如美国政府为退伍军人事务部开发的分散式医院通讯系统（DecentralizeHospitalCommunicationProgram,DHCP)W〕，盐湖城LDS医院开发的HELP系统等，其目的是实现财务、事务和医疗的信息管理功能；医院信息系统成熟于20世纪90年代，发展的重点在临床信息系统，如实验室系统、医学影像系统和重症监护系统等，旨在提高临床质量。
　　我国医院信息系统起步于20世纪70年代末，发展于20世纪90年代，以“金卫工程‘军字一号’”为代表，在局域网内全院互联互通，以医院事务管理为中心的医院信息系统逐步形成，当前我国医院信息系统基本能够覆盖医院人、财、物等管理的各个环节。但是由于我国医院信息系统建设在较低的管理水平上，系统的应用层次较低，系统标准化水平低，缺乏统一的规范和标准，难以实现不同医院信息系统间的互联互通。医院信息系统建设的下一个目标是以患者为中心，集管理、诊疗等功能为一体的集成化系统。
　　2.2.2医学成像系统现代医学图像主要包括常规X线影像、计算机X线影像、数字X线摄像、磁共振成像、超声成像和放射介入等，成像的共同特点是以不同的灰阶构成黑白对比的解剖图像。由于不同地点、不同设备厂商和不同国家的医学图像存储格式、传输方式千差万别，美国放射学会和全美电子厂商联合推出了医学数字图像通信标准（Digit-alImagingandCommunicationsinMedicine,DI-COM),定义了专用的“语义”和“语法”，实现准确的无歧义的信息交换。DIC0M直接促进了医学影像存档与通信系统（PictureArchivingandCommunicationSystems,PACS)的发展，PACS旨在解决医学图像的获取、显示、存储、传输和管理等问题,是医学图像信息化的标志。
　　2.2.3电子病历与电子健康档案电子病历（心JectronicMedicalRecords,EMR)是医院从管理信息系统向临床信息系统转变的核心，也是医院信息化建设向纵深发展的关键。自20世纪80年代开始，美国、西欧等国家和地区的一些大医院就开始建立医院内部使用的电子病历[42]。1985年，美国退伍军人事务部建立了一个分布式自动化的病人信息系统（VistA)，包括了整个美国22个区的850万退伍军人的医疗记录，1997年，VistA引进了计算机化的病历系统（Computer_basedPatientRecordsSys-tern,CPRS)[43]。此外，印第安纳大学医学分校、匹兹堡大学医学分校、波士顿EMR协会等很多机构将电子病历用于预测癌症早期病人的死亡、判断医嘱和处方的准确性等[44)。20世纪90年代中后期，随着电子病历的研究的开展，国外对电子健康档案（ElectronicHealthRecords,EHR)的研究也不断深人。HL7及相关组织、加拿大、澳大利亚及英国卫生部与欧盟的相关组织机构相继取得初步成果，先后提出EHR相关草案。例如美国HL7提出了EHR功能模型试用标准草案系列文件；加拿大提出了Alberta标准方案；澳大利亚、英国、荷兰、北爱尔兰等相继提出适用于本国的相关草案或试行方案。2007年2月21日HL7宣布《电子健康档案系统功能（ANSI/HL7EHR)》获得美国国家标准局(AmericanNationalStandardInstitute，ANSI)正式批
　　准，成为世界上第1个关于电子健康档案的国家标准。
　　我国的电子病历和电子健康档案的研究起步较晚，是伴随着卫生信息系统与社区卫生信息化的发展而展开。目前国内实施较好的是“军字一号”工程的电子病历系统，提供住院志、病程记录、其他记录、检验申请、诊疗申请、知情文件、质量监控等7个功能模块，以规范医疗文书、减少差错发生，已经在军队系统医院推广使用。此外，已有多家医院建立电子病历系统，如武警福建省总队医院于2001年8月份起正式启动了“军卫一号”网络系统；2002年7月上海岳阳中西医结合医院建立电子病历系统。2009年3月18日，中共中央、国务院发布《医药卫生体制改革近期重点实施方案(2009-2011年）》，该实施方案规定，从2009年开始逐步在全国统一建立居民健康档案，并实施规范管理。2009年5月15日，卫生部组织制定了《健康档案基本架构与数据标准（试行）》，这是我国首次发布居民健康档案的基本架构与数据标准。
　　2.2.4区域卫生信息系统区域卫生信息系统是在一定区域范围内，为卫生机构、卫生管理机构、居民、支付方及医药产品供应商等机构提供数字化形式的搜索、传递、存储、处理卫生行业数据业务和技术平台，以支持医疗卫生服务、公共卫生服务及卫生行政管理的工作过程，最终实现卫生信息资源的共享，以达到提高卫生工作质量和效率、节省有限卫生资源、更好地服务民众的目的[45]。
　　2004年，美国印第安纳州波利斯地区实现了9个县的卫生信息共享，之后美国在全国共建立了150多个州、地区或地方性的区域卫生信息组织
　　(RegionalHealthInformationOrganization,
　　RHIO)[46)。2004年4月1日，新加坡卫生部和该国两大医疗集团共同推出的“电子病历共享网”正式启动，新加坡的患者能够通过电子病历共享网享受到快速便捷且价格低廉的全面身体检查[47)。加拿大组织14个联邦和省、区域的卫生部门，成立一个非营利的机构Infoway，统一规划和协调全国的电子健康基础设施的搭建，到2009年实现覆盖50%人口，加拿大居民可通过这一计划受益[48]。目前我国区域卫生信息化建设尚处于起步阶段，在建的一些项目也处于试点阶段，如深圳市卫生局2004年底实现局部医院联网；佛山南海区2005年1月有15家医院加入区域卫生信息化平台；“厦门市民健康信息系统”已经覆盖全市80%以上的医疗机构和社区卫生服务中心。区域卫生信息化是一个工作量大、涉及业务面广的系统工程，需要充分考虑医疗卫生的各种管理要素和技术要素，才能够有计划、有步骤地逐步实现我国的区域卫生信息化。随着新医改的深人推进，我国在区域卫生信息系统建设中将会快速进步。
　　2.2.5远程医疗自从1988年远程医疗系统的概念被提出后，许多研究和实践结果都表明了远程医疗系统的可行性和实用性。国外的远程医疗大致分为3个阶段[49〕：第1阶段为20世纪60年代初至80年代中期，这一阶段的远程医疗发展较缓慢，主要是受到了通信条件的限制；第2阶段为20世纪80年代后期至90年代后期，通过卫星和综合业务数据网，提高了远程医疗的信息传递效果，在远程咨询、远程会诊、医学图像的远距离传输、远程会议和军事医学方面取得了较大进展；第3代远程医疗主要是通过公众通讯网提供服务，可以提供从客户端到桌面的医疗服务。
　　我国由于地域环境和经济条件的差异，导致各地区医疗水平有着明显的差异，特别是在广大农村和边远地区。在我国开展远程医疗，能够提高整体医疗水平。但目前在信息技术、政策法规、制度建设等方面还需要做出更多的努力。
　　2.3生物信息学
　　根据美国国立卫生研究院的定义，生物信息学是研究、开发或者应用计算工具和方法来扩展对生物学、医学、行为科学和卫生数据的使用，包括获取、存储、组织、分析和可视化这些数据[51]。E.H.Shortlife等人认为生物信息学属于医学信息学的一部分，其研究集中于细胞、分子和基因等微观对象，将信息学的方法应用于分子生物学，并产生了生物信息学的子学科——转化生物信息学
　　(TranslationalBioinformatics)〔8’51〕0
　　JOURNALOFMEDICALINFORMATICS2011,Vol.32,No.6
　　生物信息学的产生最早可以追溯到1956年在美国召开的首次“生物学中的信息理论研讨会”〔52〕，20世纪80-90年代得到快速发展。自从1990年美国启动人类基因组计划以来，人类与模式生物基因组的测序工作进展极为迅速，2006年5月，人类第一号染色体的基因测序图正式公布，标志着人类基因组计划完成。一系列组学如功能基因组学、蛋白质组学、转录组学、代谢组学、信号转导网络等应运而生，产生了海量的数据，形成了序列数据库、结构数据库、分子疾病数据库。面对海量的生物分子信息，利用数据挖掘技术实现数据清理，异构、分布的数据集成，进行DNA序列相似搜索与比对、基因组特征及基因序列的分析，发现疾病不同阶段的致病因素，可视化生物数据，整合与挖掘生物文献和基因、蛋白之间的关系等。生物信息学与计算生物学都是利用计算机和数学等知识对生物学问题进行研究，鉴于这两门学科之间并没有或难以界定严格的分界线，在这里统称为生物信息学[53]。生物信息学的研究范畴包括两个方面：生物信息学数据库和相应的算法。
　　2.3.1生物信息学数据库存储大分子信息数据的数据库称为分子生物学数据库，也称生物信息学数据库。随着分子生物学技术的发展以及组学技术的建立，生物大分子数据信息量呈现指数增长，根据存储内容的不同又可将生物信息学数据库分为基因组数据库、核酸序列数据库、蛋白质序列数据库、生物大分子（主要是蛋白质）三维空间结构数据库等[54]。
　　基因组数据库记录基因组作图及相关序列信息，例如基因组数据库（GenomeDatabase,GDB)为人类基因组计划（HumanGenomeProject,HGP)保存和处理基因组图谱数据。GDB的目标是构建关于人类基因组的百科全书，除了构建基因组图谱之外，还开发了描述序列水平的基因组内容的方法，包括序列变异和其他对功能和表型的描述。核酸序列数据库来自核酸序列测定，例如欧洲分子生物学实验室（EuropeanMolecularBiologyLaboratory,EM-
　　BL)核酸序列数据库由欧洲生物信息学研究所
　　(EuropeanBioinformaticsInstitute,EBI)维护的核酸序列数据构成，Genbank库包含了所有已知的核酸序列和蛋白质序列，以及与它们相关的文献著作和生物学注释，它是由美国国立生物技术信息中心(NationalCenterforBiotechnologyInformation,NCBI)建立和维护。蛋白质序列数据库主要来自于核酸序列翻译，因为核酸序列测定相对蛋白序列测定来说，其技术可靠性更高、自动化程度更快、信息量更大，例如国际蛋白质序列数据库（ProteinSequenceDatabase,PSD)是由蛋白质信息资源（ProteinInformationResource,PIR)、慕尼黑蛋白质序列信息中心（MunichInformationCenterforProteinSequences,MIPS)和日本国际蛋白质序列数据库
　　(JapaneseInternationalProteinInformationDatabase，
　　JIPID)共同维护的国际上最大的公共蛋白质序列数据库，这是一个全面的、经过注释的、非冗余的蛋白质序列数据库，其中包括来自几十个完整基因组的蛋白质序列。结构数据库来自X射线晶体衍射、核磁共振以及冷冻电镜技术的结构测定。蛋白质数据仓库（ProteinDataBank,PDB)是国际上唯一的生物大分子结构数据档案库，由美国Brookhaven国家实验室建立。PDB收集的数据来源于X光晶体衍射和核磁共振（NuclearMagneticResonance,NMR)的数据，经过整理和确认后存档而成。这些数据库是生物信息学的基本数据资源，通常称为基本数据库，也称为初级数据库。
　　由于初级数据库的存储容量以惊人的速率增长，从海量的初级数据库中找到未知序列，从而推断未知序列的性质和特征，是对生物信息学研究的挑战。为了使用的方便，用人工手段或者按照一定的算法自动对初级数据进行进一步的分析、整理、归纳，然后对序列或结构进行功能标注，形成具有特殊生物学意义和专门用途的数据库，这种专门/专业的数据库称为二级数据库或派生库。
　　2.3.2生物信息学算法生物信息学算法其实质就是数学算法，生物信息学研究的基因序列、转录序列和蛋白序列等的分析问题都可以从数学方面描述成字母的排序问题，但使用的方法和研究的问题各异。张春霆院士将生物信息学算法研究的内容分为序列比对、结构对比和蛋白结构预测等10个方面。
　　序列比对是生物信息学的基础，比较两个或两个以上符号序列的相似性或不相似性，两个序列的比对有较成熟的动态规划算法，相关的开源软件有BLAST和FASTA。结构比对是比较两个或两个以上蛋白质分子空间结构的相似性或不相似性。蛋白质结构预测，包括2级和3级结构预测，从观察和总结已知结构的蛋白质结构规律出发来预测未知蛋白质的结构，属于这一范畴的有同源模建和指认(Threading)方法。计算机辅助基因识别（仅指蛋白质编码基因）的基本问题是给定基因组序列后，能够正确识别基因的范围和在基因组序列中的精确位置。非编码区分析和DNA语言研究，在人类基因组中，编码部分仅占总序列的3%-5%，其他通常称为“垃圾”DNA，暂时还不知道其重要的功能。分子进化和比较基因组学是利用不同物种中同一种基因序列的异同来研究生物的进化，构建进化树，既可以用DNA序列也可以用其编码的氨基酸序列来做，甚至于可通过相关蛋白质的结构比对来研究分子进化。序列重叠群装配把大量较短的序列拼接成一个较长、完整的序列，为了正确拼接，短的序列之间应用一部分重叠区，所有相互重叠的序列全体构成了重叠群，逐步把他们拼接起来形成序列更长的重叠群，直至得到完整序列的过程称为重叠群装配。其他研究的内容还包括遗传密码的起源、基于结构的药物设计、基因表达谱分析、代谢网络分析和基因芯片设计等[53]。
　　2.4医学信息学教育和培训
　　医学信息学的交叉性学科特点要求受教育者不仅要熟练掌握信息处理的技术，而且要掌握足够的医学科学知识。过去几十年里，欧洲许多大学建立了医学信息学专业。例如，德国海德堡/海尔布隆大学于1972年就提出医学信息学课程作为医学专业的必修课，其专业课程设置已经演变到了第5版，近30年来，海德堡/海尔布隆大学的医学信息学专业的教学程序一直影响着医学信息学教育中的各种活动；在法国，医学信息学是属于医学专业，而且医学信息学教师协会推荐在医学院校的第2年讲授30学时的医学信息学课程。与欧洲相比，美国的医学信息学发展起步较晚，但是发展迅速，AMIA2011年的统计数字表明，目前仅北美地区开设有医学信息学学位课程或培训班的机构和大学就有89所[55]。1998年，阿姆斯特丹大学、海德堡/海尔布隆大学、克迪罗卫生信息科技大学、美国明尼达大学以及犹他州大学联合推出了卫生信息学教育的国际合作项目[56]，以促进医学信息学教育的开展。在亚洲，韩国大学的医学信息学教育起步虽晚，但其发展迅速，学科体系较为完善。
　　我国的医学信息学教育起步于20世纪80年代，是在医学图书情报专业的基础上发展而来，最早设置此专业的有原白求恩医科大学、原同济医科大学、中国医科大学、原湖南医科大学。截止目前，已有近40所高等院校成立了医学信息学系，学位教育主要由本科及硕士研究生两个教育层次构成，博士教育则刚刚起步。
　　关于医学信息学人员素质，历史上已有33个学术机构或组织做过探讨。在1999-2000年间，IMIA发布了医学信息学教育的国际指南，该指南被翻译成多语种并被广泛地应用和参考，指南的发布标志着该学科当时的国际现状和成熟度。在2010年IMIA更新了这一指南，新指南的发布表明医学信息学已经进入了一个新的发展时期。
　　3医学信息学研究的热点问题
　　医学信息学覆盖范围和研究内容广泛，涉及到医学、计算机科学及认知科学等诸多学科，在规范卫生事业管理、提高医疗质量、降低医疗成本等方面发挥积极作用。但是面对计算机网络和信息技术的快速发展，医学信息学在自然语言处理、大规模计算、临床决策支持等方面面临新的挑战，并出现了一些新的研究热点。
　　3.1面向语义互操作的知识组织体系构建
　　完善的知识组织体系是医学信息在各个系统间进行交互以及计算机智能处理非结构化数据的基础。传统的知识组织体系以术语表、分类表、词典?10?
　　JOURNALOFMEDICALINFORAMTICS2011.Vol.32,No.6
　　以及主题词表等为代表，辅助研究者理解和使用词汇及概念。Web3.0环境下知识组织体系强调计算机对词汇、概念以及关系的理解，以面向语义互操作的语言、技术和方法构建知识组织体系，例如RDF/Ontology等，通过构建医学本体概念化和体系化受控词表等传统知识组织内容,实现不同类型、不同层次以及不同版本的知识组织体系的集成与映射，增强各知识组织体系之间的互操作程度。
　　医学知识体系结构复杂，加之诊疗过程有一定的主观性和多变性，所以医学领域的知识组织体系能够规范人和计算机对术语、词汇以及概念的表达、理解和使用，促进医学知识的共享和复用，同时为机器自动理解医学领域知识提供有力的支撑，是实现医学信息智能检索、智能问答、机器翻译、热点监测与评价、数据挖掘、信息可视化的重要基础。研究的热点包括：医学知识组织体系的自动构建、命名实体的自动发现、不同实体间语义类型和语义关系的自动抽取与映射、本体的重用及协作等。
　　3.2跨系统和跨应用的互操作标准制定
　　跨系统和跨应用的数据交互、服务集成是解决医疗卫生信息孤岛，提供无缝式服务的重要途径。由于互操作的标准由不同地区、组织制定，应用的目的广泛，而且版本众多，在内容上存在交叉，在形式上存在差异，造成系统难以互联、信息难以共享、服务难以集成。制定跨系统和跨应用的标准规范了医学信息的表达、交换与共享，互操作标准的制定旨在提高异构系统和服务之间交换数据的能力、对数据语义理解一致的能力、彼此协同工作的能力[58]。为了建立医学术语、系统之间交互语言和语义理解一致性的基础，产生了对诊断结果、药品等各类术语进行编码的标准，如ICD;为了能在不同系统间无歧义地传递数据，制定了各类数据交换标准，如DIC0M;为了能实现系统间协同工作，出现了协调用户操作系统的行为标准，如ClinicalContextObjectWorkgroup(CC0W)等。
　　我国的卫生信息标准建设与建立实用共享的医药卫生信息系统的目标相比有较大差距，主要表现在两个方面：一是卫生信息标准体系不够完善，缺少全国统一的组织保证，医学信息学标准体系是整个卫生信息标准化工作的指南，只有建立科学的国家医学信息学标准体系，将众多的医疗卫生信息标准在此体系下协调一致，才能充分发挥信息标准的系统规范功能，获得良好的系统效应；二是现行标准的推广力度不够，标准与产业相脱节，部分标准在研制过程中，未能充分考虑实际需求，无法在实际应用中推广。
　　3.3网格和云计算
　　网格（Grid)是一种并行和分布式的计算机系统，它能够按用户的需求，如实用性、性能、成本和用户的质量服务要求，从物理上分散自治的计算机上获取计算资源，实现计算资源的共享、选择和聚合。网格计算的思想出现在20世纪90年代，旨在充分利用空闲的CPU资源，搭建平行分布式计算。丨999年提出的搜索外星人计划SETI@Home(SearchforExtraTerrestrialIntelligenceatHome)便是成功地将网格计算的思想付诸实施，构建了一个成功的案例。计算网格在医学领域中的应用实例如在大脑成像区域中脑功能成像和脑白质纤维束成像，这种成像是动态的，可视化大脑结构的联通途径，并展现临床病理特征；脑白质纤维成像是一种间接的成像技术，基础是弥散加权成像，允许抽取脑结构联通路径，如果不引人网格计算，运行该应用会耗费数小时。所以可以通过并行计算和计算网格将这些应用引入到常规的临床实践中提高吞吐量，但又不降低解决问题的质量。
　　云计算（CloudComputing)直接起源自Dell的数据中心解决方案、亚马逊EC2产品（ElasticCom-putingCloud)和Google-ffiM分布式计算项目，是一种基于互联网计算的新方式，通过互联网上异构、自治的服务为个人和企业用户提供按需即取的计算。“CloudComputing”出现在2006年，而中文“云计算”一词2008年才被最终确定下来。云计算为医学研究和医疗保健领域资源的灵活和高效整合提供了新的机遇，以其弹性、可扩展性和付费即用模式等特性为节约成本提供了很大的空间，并具有
　　JOURNALOFMEDICALINFORAAMICS2011,Vol.32,No.6
　　灵活的高吞吐量，为急需大量资源、收集和处理数TB数据信息的生物医学研究者排忧解难。除此之外，基于Web的服务器、存储、数据库以及其他云计算架构、软件和服务器还为全球范围内的医学研究者和官方机构提供了极具吸引力的整合平台。
　　网格和云计算都能通过网络获得计算能力和资源，通过互联网将计算从本地计算机转移到网络计算机上，以此获得数据或提升计算能力。网格处理的对象是计算资源，云计算处理的重点对象是存储资源；网格服务的对象是生物网格、地理网格以及教育网格等，科研使用居多，而云计算比较偏向大众应用，云计算亦被视为平民化的“网格”。云计算和网格研究的热点包括不同平台与厂商之间系统的互操作性和安全性等问题。
　　3.4医学信息学在转化医学中的应用研究
　　应用医学信息学的方法和理论于转化医学中，帮助转化医学研究者利用情报学方法和工具，发现他们需要的数据，存储和分析其在研究过程中产生的数据，共享并整合基础医学研究人员和临床医生的研究成果。医学信息学在转化医学中的应用，应致力于解决如下问题：应对基因组学、蛋白组学等数据的指数增长问题，解决海量数据的存储、传输与处理；为不同类型的数据建模，实现不同类型数据表的关联；各种数学、统计学和启发式的方法、算法以及软件的应用，通过特定的系统整合异构数据；利用本体等基于语义的规范化联接实现异构系统的互操作；结构化电子病历，挖掘基因表达数据库中的基因和临床特征数据之间的关联[59]。
　　3.5数字化人体模型建设
　　数字人研究是通过计算机技术，将人体结构数字化，在电脑屏幕上出现看得见的、能够调控的虚拟人体形态，进一步将人体功能性信息赋加到这个人体形态框架上，实现数字人海量数据三维建模与可视化，建立人体二维和三维数据集。目前数字人研究存在的难点是海量数据的处理、分布式计算以及应用计算机建模技术整合各层次的数据信息。同时如何将生理学数据、解剖学数据与现代信息技术进行无缝整合，实现从数字物理人到数字生理人,乃至到数字智能人阶段的跨越，将是数字人研究必须要解决的问题。
　　3.6临床决策支持系统的研究
　　临床决策支持系统的最大特点是知识的动态性，根据一个或者多个患者的数据为特定的案例提供治疗的建议，其需要整合医学知识库、患者数据以及推理引擎等。该系统从面向于具体应用的系统逐渐转向以患者为中心，将系统与患者的交互整合到临床的环境和工作流中。医学知识库丰富、患者数据的处理以及推理引擎的优化仍然是临床决策支持系统研究的重点，但是对系统的成本效益分析和效果的评价等逐渐成为研究的热点。
　　我国临床决策支持系统研究方向之一是将中医临床上通过四诊（望、闻、问、切）收集到的数据转化为结构化的临床数据，挖掘中医症候和疾病之间的关联关系，发现“隐藏的公开知识”。所谓的公开知识是所需要的知识均已经公开可利用，所谓的隐藏即中医证候和疾病之间的关联关系还未被完全发现，加以综合的分析应用，发现新的关系。
　　3.7认知学在医学信息学中的应用
　　医学信息学并非是医学和计算机学科之间简单的交叉，社会科学角色扮演的作用不断增加。医学信息技术的革新带来文化上、认知上的巨大变化。对于个人和组织来说，采取新技术都是不可避免的，可能会造成工作流程的破裂和用户的不满意，从医学信息学的角度来说，认知学提供了一个框架，通过技术为中介对复杂的人类行为进行分析和建模。认知学理论在医学信息学的应用中可以用来获取、塑造、设计、开发和评估医学信息系统，集中在医学信息系统的可用性和学习性中，为医学信息技术的设计和应用提供新的途径，在理解和促进医生、用户表现中发挥积极的作用。
　　3.8医学信息学应用的伦理及监管问题
　　医学信息学应用从伦理上保证“在合适的时间和地方，合适的人以合适的方式使用合适的数据”。计算机等信息技术在医学中的应用已经超越了望、闻、问、切的范围，涉及实验室检查、图像检查、辅助诊断到辅助治疗等各个环节，医学信息学应用过程中在职业、学术和教育等方面存在伦理问题。保密性和隐私性是备受关注的话题，在临床装置中信息工具的选择和使用，决定谁使用这些工具，对工具作用的评估，系统开发、维护和供应商之间的权利和义务，使用计算机跟踪临床治疗的效果以为将来实践提供更好的指导。除了伦理之外，医学信息学也涉及到法律和监管问题。
　　4我国医学信息学发展的思考
　　我国的医学信息学是20世纪80年代初在医学图书情报学的基础上发展起来的，研究体系不够完整和成熟，研究领域也不平衡，例如重视文献信息管理、技术路线和微观实践，但理论研究和学科建设较为薄弱，标准规范建设滞后，信息共享不足、缺乏系统规划，人才数量不足、质量有待提高、结构不尽合理。因此，我国医学信息学作为一门学科需要进一步明确研究对象，拓展研究领域，探索医学信息工作的基本规律和原理，融合相关学科方法，增强创新能力，加强研究机构和队伍建设，建立良好的学术交流氛围，并在应用实践中取得社会的认可。根据国际医学信息学的发展和我国的国情，从技术研究层面和实施层面提出一些思考。
　　4.1技术研究层面
　　4.1.1加强语义知识组织体系建设，整合多种类型资源结合国外医学本体研究、医学知识组织体系建设的先进理念，构建基于语义Web技术的中文一体化医学知识组织体系与标准规范，实现不同类型医学知识组织系统的集成与映射，规范概念的表达、术语的使用和关系的连接。以此为基础，整合文献、电子病历数据、图像数据、蛋白数据、基因组数据等多种类型资源，利用医学信息学的方法为不同类型的数据建模，建立相关数据模型的连接，最大范围共享知识和研究成果，同时深度挖掘数据中的隐性知识，加快基础研究成果转化的进程。
　　4.1.2加强卫生信息标准制定，促进卫生信息资源共享进一步加强卫生信息标准的研制和推广力度。对于标准不统一且影响互操作性的关键领域要加快标准和规范的制定；对于已经有的成熟标准或规范，要由政府主导，自上而下地推广应用。同时，建立标准实施效果评测的指标体系，使标准的开发与利用纵深化。通过语义知识组织体系的构建和标准的实施，推进公共卫生、医疗服务、新农合医疗保障、基本药物制度和综合管理5个业务系统的互联互通，促进国家、省和地市级医疗卫生数据的共享。
　　4.1.3加强卫生信息系统建设，提高卫生事业管理效率全面加强卫生信息系统的建设，包括医院信息系统、区域卫生信息系统等多个层次。通过整合医疗卫生机构内部系统，减少内部系统数量，提高系统的应用层次和标准化水平，大力加强电子病历和电子健康档案建设，推动医院管理信息系统向临床信息系统的转变；通过区域卫生信息系统建设以支持医疗服务、公共卫生服务及卫生管理等工作过程，建设以用户为中心的集诊疗、预防保健、医疗保险、管理决策等功能为一体的集成、实用、共享的卫生信息系统，达到提高卫生工作质量和效率、节省有限卫生资源、更好地服务民众的目的。4.1.4加强生物信息学研究，推动医学科技发展加强生物信息学理论和方法在转化医学中的应用，共享并整合基础和临床研究的成果，致力于解决基因组学、蛋白组学等海量数据的存储、传输与处理，实现不同类型数据表的关联，整合异构数据，挖掘基因表达数据库中的基因和临床特征数据之间的关联，加快医学成果转化。
　　4.1.5扩大情报学方法支持，辅助卫生决策充分利用科学计量学、关联分析、数据挖掘等多种情报学方法和现代信息技术，对卫生数据、网络信息、医学文献等进行深度的挖掘、分析、关联和处理，形成辅助评价指标、模型与应用系统，为决策提供支持。包括围绕国家卫生决策部门和医药卫生体制改革的中心工作，建设支持卫生决策的信息资源库与知识库，开展知识服务；为电子健康档案、卫生资源管理、疾病研究、用药监督等领域建立信
　　息分析平台，从错综复杂、内涵丰富的海量数据中发现隐含的客观规律，实现信息化、标准化、智能化、集成化的医疗卫生决策支持，推动区域医疗卫生事业的科学化管理等。
　　4.2实施层面
　　4.2.1制定国家医学信息学发展规划，系统深入开展医学信息学研究我国医学信息学的研究主体比较分散，且多数是以实用为目的的研究和开发，广度和深度都还不够。应紧密结合当前国家卫生信息化发展的总体规划，编制我国医学信息学的发展规划，确定战略重点和优先领域，并制定相应的政策措施。同时，充分利用中华医学会医学信息学分会的平台，跟踪国际医学信息学领域的发展动态，协调医学院校、医疗机构、医学信息研究机构、医学信息技术公司之间的合作，共同开展医学信息学重大项目的研究和应用。
　　4.2.2建立创新服务模式，面向不同用户需求提供深层次医学知识服务建设集成信息服务的医学数字图书馆，促进信息传播、利用和共享。面向社会大众，提供医学科普知识，提升医学信息素养；面向卫生决策者，组建跨学科、跨组织的研究团队，构建战略分析平台和卫生决策支持平台，辅助卫生决策；面向医、教、研人员，根据工作流程建立嵌人式的服务模式，以咨询、问题解决方案等形式为用户提供深层次、全方位、动态性的知识产品和技术支撑。
　　4.2.3加快技术应用和资金投入，解决医学信息资源分布的不均衡性加快远程医疗技术应用，改变原有就医的单一模式，改善专家资源分布不均衡的现状，让边远地区及更多的患者、医护人员能更经济、更高效地共享专家资源、教育资源、医学科技成果资源。加大卫生信息化、网络信息基础设施等资金和技术的倾斜，促进东部发达地区对西部地区的技术援助和对口支持，并借助于社区卫生信息化、区域卫生信息化建设，推进欠发达地区医学信息事业的发展。
　　4.2.4加快人才培养和学科体系建设，为医学信息学发展提供智力支持加强医学信息学专业人才培养，在继续发展本科教育的同时，停办中等教育层次的医学信息学教育，加快发展研究生教育，增加医学信息学专业的硕士点和博士点，建立医学信息学专业博士后科研流动站，逐步形成以本科教育为基础，以硕士和博士研究生教育为主体的多层次医学信息学专业教育的基本格局。同时，加大高层次人才和紧缺人才的培养和引进力度，加强青年学术骨干队伍建设，建立以学科带头人为核心，围绕重大项目凝聚学术队伍的人才组织模式，构建结构合理、团结高效的合作团队，形成一批优秀学术团队和学术梯队，促进医学信息学学科全面发展。
　　5结语
　　医学信息学作为一门新兴交叉学科，正处于快速发展时期。回顾医学信息学的内涵和发展历程，有助于厘清医学信息学发展面临的问题和趋势。我国医学信息学的发展与国际先进水平相比仍有较大差距，但新一轮的医药卫生体制改革方案明确提出要建立高效统一、系统整合、互联互通和实用共享的医药卫生信息系统，并将其作为新医改的重要支撑，这为我国医学信息学的发展提供了历史性机遇。作为医学信息工作者，我们应该抓住机遇，借鉴国际先进经验，紧密结合我国实际，扎实做好各项工作，努力推动我国医学信息学学科的快速发展。

工信部备案：苏ICP备20026650号-10 增值电信业务经营许可证：苏B2-20220836

公安部备案号：32040202000409 出版物经营许可证：新出发苏零字第D-T086号

本站主要从事期刊杂志零售，不是任何杂志官网，不涉及出版事务，特此申明。