Atualmente a gama de conteúdos médicos disponíveis na Web é muito vasta, principalmente a de casos clínicos que servem de base para estudos e análises, entretanto muitos desses dados se encontram sem estruturas e originam de fontes heterogêneas, tornando difícil a busca indexação e análise dos dados. Assim esse presente trabalho propõem um modelo de metadados visando padronizar tais conteúdos e servindo como base para utilização de técnicas de mineração de texto convencionais e por PLN para seu povoamento, para futuras buscas, recuperações e manutenções com maior qualidade.
Currently the range of medical content available on the Web is very wide, mainly clinical cases that serve as the basis for studies and analyzes, however many of these data are without structures and originate from heterogeneous sources, making it difficult to search indexing and data analysis. Thus, this work proposes a metadata model to standardize such contents and serves as a basis for the use of conventional text mining techniques and PLN for their settlement, for future searches, recoveries and maintenance with higher quality.