cÔng trÌnh dỰ thi giẢi thƯỞng “sinh viÊn ... · inverted index 13 2.2.2. ranking...

36
TRƯỜNG ĐẠI HC CÔNG NGH- ĐHQGHN KHOA CÔNG NGHTHÔNG TIN ***************** CÔNG TRÌNH DTHI GII THƯỞNG “SINH VIÊN NGHIÊN CU KHOA HC” NĂM 2016 Tên công trình: Healthkee: dch vhtrchn đoán và cá nhân hoá thông tin sc kho, y tế (Healthkee: a symptom checker and personalized health information service) Nhóm sinh viên: 1. Hvà tên: Nguyn Văn Giáp Mã sinh viên: 12020110 Lp: K57CA 2. Hvà tên: Lê Đình Minh Mã sinh viên: 12020609 Lp: K57CA 3. Hvà tên: Vũ Vit Anh Mã sinh viên: 12020010 Lp: K57CLC Người hướng dn: TS. Phan Xuân Hiếu Hà Ni, 20/03/2016

Upload: others

Post on 26-Jun-2020

5 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: CÔNG TRÌNH DỰ THI GIẢI THƯỞNG “SINH VIÊN ... · Inverted Index 13 2.2.2. Ranking results with a search query 14 2.3. Data Structures 15 ... using a search engine like

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ - ĐHQGHN

KHOA CÔNG NGHỆ THÔNG TIN

*****************

CÔNG TRÌNH DỰ THI

GIẢI THƯỞNG “SINH VIÊN NGHIÊN CỨU KHOA HỌC”

NĂM 2016

Tên công trình:

Healthkee: dịch vụ hỗ trợ chẩn đoán và cá nhân hoá thông tin sức khoẻ, y tế

(Healthkee: a symptom checker and personalized health information service)

Nhóm sinh viên: 1. Họ và tên: Nguyễn Văn Giáp Mã sinh viên: 12020110 Lớp: K57CA

2. Họ và tên: Lê Đình Minh Mã sinh viên: 12020609 Lớp: K57CA

3. Họ và tên: Vũ Việt Anh Mã sinh viên: 12020010 Lớp: K57CLC

Người hướng dẫn: TS. Phan Xuân Hiếu

Hà Nội, 20/03/2016

Page 2: CÔNG TRÌNH DỰ THI GIẢI THƯỞNG “SINH VIÊN ... · Inverted Index 13 2.2.2. Ranking results with a search query 14 2.3. Data Structures 15 ... using a search engine like

1

Table of contents I. Problem Statement ..………………………………………………………….. 4

1.1. Motivations and Challenges 4

1.2. Problem Definition 6

1.3. Related Works 7

1.4. Contributions and Applications 8

1.4.1. Methods 8

1.4.2. Applications & Community 8

1.4.3. Medical data 9

II. Problem Solving ...……………………………………………………………. 9

2.1. Medical Data 9

2.2. Searching 12

2.2.1. Inverted Index 13

2.2.2. Ranking results with a search query 14

2.3. Data Structures 15

2.3.1. User Accounts, Profiles, and Interests 15

2.3.1.1. User Profiles 15

2.3.1.2. User Account 15

2.3.1.3. User Interests 15

2.3.2. Symptoms 15

2.3.3. Conditions 16

2.4. Symptom Checker 16

2.4.1. Conditions and Symptoms Relevance 16

Page 3: CÔNG TRÌNH DỰ THI GIẢI THƯỞNG “SINH VIÊN ... · Inverted Index 13 2.2.2. Ranking results with a search query 14 2.3. Data Structures 15 ... using a search engine like

2

2.4.1.1. Using Jaccard similarity coefficient 16

2.4.1.2. Using Symcat 16

2.4.2. Condition Ranking–based Diagnosis 18

2.5. Symptom Suggestion 19

2.6. Personalization and Recommendation 21

2.6.1. Medical articles crawling 21

2.6.2. LDA model estimation 21

2.6.3. Similarity calculation 23

2.6.3. Recommendation system 23

2.7. Evaluation and Analysis 26

III. Conclusions and Future Works ………………………………………...….. 26

IV. References ………………………………………...…………………………. 28

V. Appendix ………………………………………...……………………………. 29

Page 4: CÔNG TRÌNH DỰ THI GIẢI THƯỞNG “SINH VIÊN ... · Inverted Index 13 2.2.2. Ranking results with a search query 14 2.3. Data Structures 15 ... using a search engine like

3

Abstract

Nowadays, people often use the Internet to get medical information, and some people even use it as self-diagnosis aid at home. There are many tools in English can support self-diagnosis as well as provide medical information to users such as WebMD, MayoClinic, NHS Choice, etc. However, there are not many same systems in Vietnam that can provide reliable and easy to understand clinical information. For example, ZinMed is a tool to support diabetes treatment, WikiMed is a knowledge and information network health and Udoctor play a role as the connection between patients and doctors. In this report, we will introduce a new system in Vietnamese called Healthkee combining a symptom checker and a recommendation system for healthcare news. Healthkee aims to become a smart health assistant that provide personalized health information, which is accurate, fast and easy to understand at anywhere, anytime.

Page 5: CÔNG TRÌNH DỰ THI GIẢI THƯỞNG “SINH VIÊN ... · Inverted Index 13 2.2.2. Ranking results with a search query 14 2.3. Data Structures 15 ... using a search engine like

4

I. Problem Statement

1.1. Motivations and Challenges

In the Age of the Internet, the Vietnamese use online system to search for medical information or even self-diagnose themselves. Therefore, it is required to develop reliable and ease of use software systems that provides accurate, fast and accessible healthcare information in Vietnamese.

For diagnosis aid, in particular, there are thousands of clinical decision support system (also known as the medical expert system); for example DXplain1, DiagnosisPro2, MYCIN3. These systems are often specialized for professionals like doctors or medical students in clinical rotations. They have a complex interface with tons of functions, require software or hardware dependencies, and often expensive to develop and maintain. As a result, it is inaccessible for normal people in daily usage.

Many people start with a search engine such as Google, Bing, Yahoo as a diagnosis aid5 6. From a survey conducted by the Pew Research Center’s Internet & American Life Project4 in 2013, there are 59% of U.S. adults have looked online for healthcare information in 2012 and 35% have gone online to figure out what medical condition they or someone else might have. However, the search engines are not designed to solve diagnostic problems, search results can contain lots of not related, confusing, unsubstantiated information especially for elder people7, and people with urgent symptoms may not be sought emergency care because of the lack of information about whether a symptom needs urgent attention8. In addition, using a search engine like Google required some search skills like choosing search terms effectively, good reading skills and prior knowledge to infer diagnosis from a bulk of returned links.

In recent years, people increasingly use some computerized programs called symptom checkers to research health concern such as self-diagnosis and triage advices9. Many companies or organizations have launched their symptoms checker such as

Page 6: CÔNG TRÌNH DỰ THI GIẢI THƯỞNG “SINH VIÊN ... · Inverted Index 13 2.2.2. Ranking results with a search query 14 2.3. Data Structures 15 ... using a search engine like

5

WebMD1, Mayo Clinic2, NHS Choice3, Symcat4, Your.MD5, iTriage6, etc. Symptom Checker is a software program that uses computerized algorithms to ask a series of questions about user’s symptoms or let them input their symptoms by themselves. These symptom checkers are usually hosted on a website but some have an application on smartphone (Android, iOS) as well. Theses softwares are used by a numerous people all over the world. For example, WebMD for Android by WebMD, LLC got over five millions installs in Google Play Store and iTriage reports they get over 50 million sessions in a year10. Symptom checkers have some potential benefits. They encourage people to seek emergency care in case of inputting dangerous symptoms like stroke or heart attack. In some other cases that only require self care, symptom checkers can recommend user to stay home. That can help to resolve overloading hospitals problem and save patients’ time and money. In some cases, it prevents the patients to use unnecessary antibiotics that can lead to "overprescribing of antibiotics". However, many people expressed doubts about the correctness of these applications. They can cause unpredictable effects such as wrong diagnosis, unreliable health information, etc. In fact, a paper from BMJ7 called “Evaluation of symptom checkers for self-diagnosis and triage: audit study”11 did research to determine the accuracy of 23 symptom checkers and concluded that they all had deficits in both diagnosis and triage. Therefore, these symptom checkers need to enhance the accuracy and supplement its deficiencies. However, it would also somewhat better than using search engines to diagnose and triage.

When we looking for the diagnostic tools or softwares providing medical information for Vietnamese, especially on mobile, we could not find much in Vietnamese. Some are just products for a specific disease such as ZinMed8, some seem to

1 WebMD is an American corporation known primarily as an online publisher of news and information

pertaining to human health and well-being. 2 Mayo Clinic is a nonprofit medical practice and medical research group based in Rochester, Minnesota. 3 The National Health Service is the publicly funded healthcare system for England. It is the largest and the

oldest single-payer healthcare system in the world. 4 A disease calculator that uses hundreds of thousands of patient records to estimate probability of disease. 5 Your.MD operates a platform to provide users with personalised health information. 6 iTriage is a free app that lets users quickly and easily get medical answers, find care options and securely

maintain health information. 7 The BMJ (formerly the British Medical Journal) is an international peer reviewed medical journal and a

fully online first publication. 8 "Zinmed - Giải pháp quản lý điều trị bệnh tiểu đường." 2008. 21 Mar. 2016

Page 7: CÔNG TRÌNH DỰ THI GIẢI THƯỞNG “SINH VIÊN ... · Inverted Index 13 2.2.2. Ranking results with a search query 14 2.3. Data Structures 15 ... using a search engine like

6

be a knowledge and information network health such as WikiMed9, some play a role as the connection between patients and doctors such as Udoctor10 or eDoctor11, many websites offer only general health information12 13 or the information may not be verified and updated. Moreover, the medical information in Vietnamese is often in the form of journal entries, or in the textbooks of medical students. There is a lack of public information about conditions, symptoms, medicines, tests and procedures in Vietnamese. Therefore, it is challenging to build a symptom checker in Vietnamese because it costs a lot of time and effort to build data sets. In fact, we have collaborated with a group of medical students worked continuously for several months to build databases for applications including the selection and assessment of data sources, data extraction, translation, inferring the information gaps. However, the system is still in an early stage with a clinical level because of the lack of information about patient's disease profile or conducted tests and procedures.

1.2. Problem Definition

“Personal Smart Health Assistant”, which is called Healthkee in short, is a smart health assistant run on smartphone that provide personalized health information. Healthkee has two main parts: symptom checker and medical articles recommendation system. Symptom checker can help people can easily narrow down the conditions they may suffer by inputting a few proper symptoms. User can easily find necessary information about suspected conditions such as symptoms they may suffer; treatment; prevention; resting regime; what steps they should take to remedy their illness, including when to see a doctor; and how to identify, treat, and live with conditions. In addition, we also implement a recommendation system to help users get personalized articles related to their medical interests. The application requires a modern, interactive and user-friendly User’s Interface which is free, accurate, fast at anywhere and anytime. The results outputted by the application need to be good enough for daily usage and informative enough for reference purposes.

9 "WikiMed - Mạng kiến thức và thông tin y tế." 2015. 21 Mar. 2016 10 "Udoctor- Hỏi bác sĩ miễn phí." 2015. 21 Mar. 2016 11 "eDoctor - Kết nối bác sĩ mọi lúc mọi nơi." 2014. 21 Mar. 2016 12 "Sức Khỏe Gia Đình, cách Phòng Bệnh & chăm sóc ... - aFamily." 2012. 21 Mar. 2016 13 "Báo sức khỏe đời sống – Cơ quan ngôn luận của Bộ Y Tế." 2008. 21 Mar. 2016

Page 8: CÔNG TRÌNH DỰ THI GIẢI THƯỞNG “SINH VIÊN ... · Inverted Index 13 2.2.2. Ranking results with a search query 14 2.3. Data Structures 15 ... using a search engine like

7

We can also define the system as Fig. 1:

Fig. 1: An overview of the structure of system

At time!, user " ∈ % in our system are using profile & ∈ '((if he does not sign in to the system, " ≡ "*and & ≡ &*. Let+is the set of all symptoms in our system. We define +(, is the set of symptoms selected by user (added by searching or through symptom suggestion). Based on all the information known about ", &, system makes suggestions for " with the most relevant symptoms. The most relevant concept is understood as the symptoms users can be facing and not selected and thereby help lead users to come to appropriate disease that users may suffer from.

When user interacts with system, user’s behaviors such as read, like, share, bookmark, search, etc are logged combining with demographic information of user are processed by Recommendation System to deliver articles related to user’s medical interests. Therefore, users will not have to waste time looking for valuable health information.

1.3. Related Works

There are a lot of symptom checkers in English which is provided by well-known hospitals or organization such as WebMD, Symcat, Mayo Clinic, iTriage, etc. They usually ask a series of questions about user’s symptoms or let them input their symptoms by themselves. These symptom checkers are usually hosted in a website but some have application on smartphone (Android, iOS) as well. Theses softwares are used by a numerous people all over the world. For example, WebMD for Android by WebMD, LLC got over five millions installs in Google Play Store and iTriage reports they get over

Page 9: CÔNG TRÌNH DỰ THI GIẢI THƯỞNG “SINH VIÊN ... · Inverted Index 13 2.2.2. Ranking results with a search query 14 2.3. Data Structures 15 ... using a search engine like

8

50 millions sessions in a year10. Beside symptom checkers, those softwares also provide medical information.

There are not many diagnostic tools or softwares providing medical information for Vietnamese, especially on mobile. Some of them are are just products for a specific disease such as ZinMed14 or some play a role as the connection between patients and doctors such as Udoctor15 or eDoctor16, many websites offer only general health information17 18 or the information may not be verified and updated.

In this report, we will introduce a new system in Vietnamese called Healthkee combining a symptom checker and a recommendation system for healthcare news.

1.4. Contributions and Applications

1.4.1. Methods

With each of the above issues we build a model which get the demographic information, picked symptom and logged behavior of user as input and output the appropriate symptoms, conditions or health information. Details of these model will be explained in below sections.

1.4.2. Applications & Community

Healthkee is a personal smart health assistant that helps users figure out what to do when they get sick by input their symptoms and demographic. That is not a problem if user can not remember all of their symptom because it can make some symptom suggestion to users. Furthermore, Healthkee is a place that users can get any information about health, it also delivers to user the information they may be interested in. Now you do not have to spend time between lots of health information on the Internet. Everything is quick and convenient.

When people get sick, they have several options for obtaining health care. These include going to the clinic, hospitals or calling a doctor or nurse. People usually choose

14 "Zinmed - Giải pháp quản lý điều trị bệnh tiểu đường." 2008. 21 Mar. 2016 15 "Udoctor- Hỏi bác sĩ miễn phí." 2015. 21 Mar. 2016 16 "eDoctor - Kết nối bác sĩ mọi lúc mọi nơi." 2014. 21 Mar. 2016 17 "Sức Khỏe Gia Đình, cách Phòng Bệnh & chăm sóc ... - aFamily." 2012. 21 Mar. 2016 18 "Báo sức khỏe đời sống – Cơ quan ngôn luận của Bộ Y Tế." 2008. 21 Mar. 2016

Page 10: CÔNG TRÌNH DỰ THI GIẢI THƯỞNG “SINH VIÊN ... · Inverted Index 13 2.2.2. Ranking results with a search query 14 2.3. Data Structures 15 ... using a search engine like

9

the big hospitals despite their disease can be cured in the small clinic, that is why big hospitals in Vietnam are always in overload. The cause of this problem is because people did not know any information about their symptoms and conditions. This can be solved by Healthkee. Our app will provide user initial information about their symptom and condition from which users can determine what should do next and avoid misplaced diagnosis and treatment. This has great significance in reducing the load on the big hospitals as well as reduce the travel costs of patient.

1.4.3. Medical data

We have built a database in Vietnamese with about 150 conditions, 711 symptoms, 379 risk factors, 525 medications, 81 tests and procedures, 177 complications as shown in Table 1. The data is collected, verified and edited by collaborators at Hanoi Medical University.

II. Problem Solving

2.1. Medical Data

One of the time-consuming work and required lots of efforts when developing the system is to build the medical database. The public information on health in Vietnamese is often incomplete, lacking consistency and unstructured. Therefore, we decided to collect medical data from websites about medical in English of famous hospitals or large organizations such as Mayo Clinic, WebMD or NHS Choice, etc to build the database by ourselves which should be structured and can be used in building a symptom checker for Vietnamese.

We have partnered with a group of students at Hanoi Medical University worked continuously for several months to build the database. First of all, we choose the 150 most common diseases (Fig. 3) in Vietnam which is provided by Hanoi Medical University Hospital19, Vietnam – Germany Hospital20, Bach Mai Hospital21, National

19 Hospital of Hanoi Medical University (HMU) - HMU has been known as the leading education entity in

the country in training and providing highly qualified human resources for the health sector in Vietnam. 20 Viet Duc Hospital is the largest surgical center of Vietnam, situated at Trang Thi Street, Hanoi. The

Hospital was founded in 1904 as a part of Indochina Medical College by the French colonial governor Paul Doumer. 21 Bach Mai Hospital is a multi-field medical facility in Hanoi and is considered one of the largest in

Vietnam. The hospital was established in 1911 during the French colonial rule.

Page 11: CÔNG TRÌNH DỰ THI GIẢI THƯỞNG “SINH VIÊN ... · Inverted Index 13 2.2.2. Ranking results with a search query 14 2.3. Data Structures 15 ... using a search engine like

10

Hospital of Obstetrics and Gynecology22, Vietnam National Hospital of Pediatrics23 to carry out medical data construction. After that, we find the related symptoms, risk factors, complications of the disease, tests and procedures usually do, and medications commonly used (Fig. 4). Then we translate the collected medical data into Vietnamese, but still archive the English version for reviewing later. The data is now structured and can be used, but still lack the necessary information to build a symptom checker such as the relationship between the symptoms and symptoms. From this data, we collect from Symcat24. Currently, the database has 150 conditions, 711 symptoms, 379 risk factors, 525 medications, 81 tests and procedures, 177 complications (Fig. 5). The construction of medical data does not simply collect and translate. Some fields also require specialized knowledge of medical school students such as classification of conditions according to age, gender; determine the prevalence and severity of the disease or to determine whether being a genetic disease or not. After those processed, we get the database with schema describing in Fig. 6.

Fig. 2: List of 150 common diseases in Vietnam 22 National Hospital of Obstetrics and Gynecology is the highest professional and specialized Gynaecology

and Neonatology Vietnam, is the center of higher education and graduate. 23 Vietnam National Hospital of Pediatrics is a medical facility in Hanoi. Initially established in 1969 as

Institute for the Protection of Children's Health. 24 Symcat use machine learning algorithms to calculate disease frequency and likelihood based on patient

data from Centers for Disease Control and Prevention (CDC).

Page 12: CÔNG TRÌNH DỰ THI GIẢI THƯỞNG “SINH VIÊN ... · Inverted Index 13 2.2.2. Ranking results with a search query 14 2.3. Data Structures 15 ... using a search engine like

11

Fig. 3: Backend to input necessary information for a condition

Fig. 4: Backend for medical student to input medical data

Page 13: CÔNG TRÌNH DỰ THI GIẢI THƯỞNG “SINH VIÊN ... · Inverted Index 13 2.2.2. Ranking results with a search query 14 2.3. Data Structures 15 ... using a search engine like

12

Fig 5. Schema of Healthkee database

2.2. Searching

Searching is the main action when user use Healthkee because it helps user to get quick access to symptoms, conditions or other concepts. It is defined as follow:

At time!, user " ∈ % typed a set of words w = {w1, w2,..., wn, sl} (w1, w2,..., wn are words separated by space and sl1 is the letter sequence) into the search bar. Based on w we must provide to users a list of best match concepts with w, as shown in Fig. 6.

Page 14: CÔNG TRÌNH DỰ THI GIẢI THƯỞNG “SINH VIÊN ... · Inverted Index 13 2.2.2. Ranking results with a search query 14 2.3. Data Structures 15 ... using a search engine like

13

Fig 6. Two search cases in Healthkee

2.2.1. Inverted Index

Inverted index technique is used to store mapping from words and letter sequences to their location in concept phrases. We use two type of inverted index: inverted index between words and phrases and inverted index between letter sequences and words. The inverted index is saved in a file and is loaded when user opens app.

The inverted index between words and phrases is a map from words to phrases. Each word has a list of phrases which contain this word and the occurred position of the word in each phrase.

Inverted index between letter sequences and words is a map from letter sequences to words. Each letter sequence has a list of words which contain the letter sequence and the occurred position of the letter sequence on each word.

2.2.2. Ranking results with a search query

With two type of inverted index as above, search action will be performed as follow:

Let w = {w1, w2,..., wn, sl} is the input of user. P = {p1, p2,..., pn} is the set of concept phrase in the system. f(wi, pj) is the relevance between word wi and phrase pj. f(wi, pj) is defined as:

.(01, &2) = (567(899":(01, &2), ;6<7(01, &2))

Page 15: CÔNG TRÌNH DỰ THI GIẢI THƯỞNG “SINH VIÊN ... · Inverted Index 13 2.2.2. Ranking results with a search query 14 2.3. Data Structures 15 ... using a search engine like

14

In which: - occur(wi, pj) is the set of occurrence positions of word wi and phrase pj

-

Let wt = {wt1, wt2, …, wtm}is the set of words which contain sl and g(wti) is the relevance between sl and wti. g(wti) is defined as:

<(0,1) = 567(899":(;=, 0,1)) + =?7<!ℎ(0,1) − =?7<!ℎ(;=)

In which length(x) is number of character in x

Relevance between each word wti in wt with phrase &2 is defined as:

.(0,1, &2) = (567(899":(0,1, &2), ;6<7(0,1, &2)) + <(0,1)

In which:

Relevance score of which user typed 0and phrase &2 is a vector contains 7 + 1elements defined as:

;98:?(&2) = (.(0C, &2), .(0D, &2), . . . , .(0F, &2),567(.(0,1, &2))

In which two elements .C = (GH="?C, ;6<7C)and .D = (GH="?D, ;6<7D) are compared with following rules:

- If ;6<7C equal ;6<7D: element with larger GH="? is larger. - If ;6<7C not equal ;6<7D: element with sign = −1 is larger.

Finally, we ranking each phrase &2in 'based on ;98:?(&2). Two element ;98:?(&1)and

;98:?(&2)are compared with following rules: - Let ! = 567(M|1 ≤ M ≤ 7 + 1; ;98:?(&1)[M] ≠ ;98:?(&2)[M])

- ;98:?(&1) > ;98:?(&2) if ;98:?(&1)[M] > ;98:?(&2)[M]

- ;98:?(&1) < ;98:?(&2) if ;98:?(&1)[M] < ;98:?(&2)[M]

- ;98:?(&1) = ;98:?(&2) if ;98:?(&1)[M] = ;98:?(&2)[M]

Page 16: CÔNG TRÌNH DỰ THI GIẢI THƯỞNG “SINH VIÊN ... · Inverted Index 13 2.2.2. Ranking results with a search query 14 2.3. Data Structures 15 ... using a search engine like

15

Phrase with lower ;98:? tend to be more relevance with which user typed and will be ranked higher.

2.3. Data Structures

2.3.1. User Accounts, Profiles, and Interests

2.3.1.1. User Profiles

Each profile of user & include the following information: - HV: age or age range of the profile &

- <V: gender of the profile &

2.3.1.2. User Account

Let % = {"X, "C, "D, . . . , "Y} is a list of user accounts [, within "X is correspond user not logged into the system. Each account " ∈ %(" ≠ "X) includes the following information:

- 7H5?(: User’s name - \8](: User’s year of birth - '( = {&*, &C, . . . }: The list of profiles associated with account ". Each

account can have one or more profiles. The first profile in the list &C is the default profile will be created at the time the account is created.

- ^(: The structure that holds information about account " (See 2.3.1.3)

2.3.1.3. User Interests

Interests of an account" ∈ % is defined with the following structure: - ^ = {(!C, 0C), (!D, 0D), . . . } is a list of topics that account " be interested in

(topics of interest - _8^). In which, each component (!1, 01) ∈ _8^( is defined as follow: !1 is the topic that " is concerned, the weight01denote the level of interest. The topic will be analyzed automatically from the medical articles or be created manually as "lose weight", "malnutrition" "Mother and baby", etc.

2.3.2. Symptoms

Let + = {;C, ;D, . . . ;`} is a list a symptoms. Each symptom can be related to one or more conditions or symptoms.

Page 17: CÔNG TRÌNH DỰ THI GIẢI THƯỞNG “SINH VIÊN ... · Inverted Index 13 2.2.2. Ranking results with a search query 14 2.3. Data Structures 15 ... using a search engine like

16

2.3.3. Conditions

Let b = {9C, 9D, . . . 9Y} is a set of [ diseases. Each condition can be related to one or more symptoms.

2.4. Symptom Checker

2.4.1. Conditions and Symptoms Relevance

2.4.1.1. Using Jaccard similarity coefficient

Let :(;1, 92) is the level of association between symptom ;1 and condition 92 and :(;1, ;2) is the level of association between symptoms ;1, ;2. Note that :(;1, 92)and

:(;1, ;2) are asymmetry (:(;1, 92) ≠ :(;2, 91) and :(;1, ;2) ≠ :(;2, ;1))

Because of lacking information, we tried to infer that information through Jaccard similarity coefficient as follow:

in which, +cdand +ceare the sets of symptoms of condition 91and 92.

in which, parameter H = 1.0 and M = 10, 15, 20, . .. (a positive integer).

2.4.1.2. Using Symcat

However, after implementing and evaluating, we found that the accuracy is not reasonable. Therefore, we collect this information from Symcat for a smoother implementation (Fig. 7). Symcat use machine learning algorithms to calculate disease frequency and likelihood based on patient data from Centers for Disease Control and Prevention (CDC). We can collect the following information from Symcat:

- &(9|;): the probability of condition 9can cause symptom ; - &(;1|;2): the probability of symptom ;1 can co-occurrence when user have

symptom ;2

Page 18: CÔNG TRÌNH DỰ THI GIẢI THƯỞNG “SINH VIÊN ... · Inverted Index 13 2.2.2. Ranking results with a search query 14 2.3. Data Structures 15 ... using a search engine like

17

- &(;|9): the probability of symptom ;user may have when they suffer from condition 9

Because of the differences of the medical database between ours and Symcat’s, we define:

- ij = +*(k ∩ +jmn, in which +*(kis our set of symptoms and +jmn is Symcat’s

- io = b*(k ∩ bjmn, in which b*(kis our set of conditions and bjmn is Symcat’s

Therefore, we can define :(9, ;)and :(;1, ;2)as follow:

Fig. 7: Condition-Symptom relevance from Symcat

Page 19: CÔNG TRÌNH DỰ THI GIẢI THƯỞNG “SINH VIÊN ... · Inverted Index 13 2.2.2. Ranking results with a search query 14 2.3. Data Structures 15 ... using a search engine like

18

2.4.2. Condition Ranking–based Diagnosis

Let .C: 2j×b → sis a function mapping from binary relations 2j×b into real domain s. In which, 2j is the set of all subsets (power set) of the set of symptoms + and b is set of diseases. For example, user " currently selected a set of symptoms +(, function .C(+(, 9) indicates the level of relationship between the set of selected symptoms (+() and diseases 9 ∈ b. In other words, the value of the function .C(+(, 9) is greater, it is more likely user " suffering from condition 9.

For a simple diagnosis aid algorithm, we need to estimate the value of the function .C(+(, 9) for all condition c � C and then rank them in descending order by value of .C. .C is defined as follows:

in which: - +ois the set symptoms of condition 9 - :?=(;, 9) = :(9, ;) represent how likely condition 9 is can cause symptom ;

and is defined as section 2.4.1. - <(+(, +o) determine how close it is between the set of user selected

symptoms +(and the set symptoms of condition 9(+o) and is calculated by the following formula:

- ℎ(+(, +o) is calculated as follow:

in which, - +(o = +( ∩ +o

- - :(;1, ;2) and :(;2, ;1)is defined in section 2.4.1

Therefore, we can rewrite the formula of .C as follow:

Page 20: CÔNG TRÌNH DỰ THI GIẢI THƯỞNG “SINH VIÊN ... · Inverted Index 13 2.2.2. Ranking results with a search query 14 2.3. Data Structures 15 ... using a search engine like

19

The pictures below show how symptom checker working in Healthkee:

Picture: A accuracy case of symptom checker (see case 20 in Appendix 2)

2.5. Symptom Suggestion

At time!, user" ∈ %in our system are using profile & ∈ '((if he does not sign in to the system, " ≡ "*and & ≡ &*. Let+is the set of all symptoms in our system. We define +(

, is the set of symptoms selected by user (added by searching or through symptom suggestion). Based on all the information known about ", &, system makes suggestions for " with the most relevant symptoms. The most relevant concept is understood as the symptoms users can be facing and not selected and thereby help lead users to come to appropriate disease that users may suffer from.

Let b(, is the set of all conditions which is related with one or more symptom in +(,:

b(, = ct

j∈uvw

In which bjis the set of all conditions which is related to symptom ;.

Page 21: CÔNG TRÌNH DỰ THI GIẢI THƯỞNG “SINH VIÊN ... · Inverted Index 13 2.2.2. Ranking results with a search query 14 2.3. Data Structures 15 ... using a search engine like

20

Let +(xyy, is the set of all symptoms which is related with one or more condition in b(, (involve the symptoms in +(,):

+(xyy, =

uz

o∈cvw

In which +ois the set of all symptoms which is related to condition 9.

Meanwhile, a set of symptoms can be suggested for user ", denoted as +(c{F|, , is the set +(xyy, eliminate all symptoms which are chosen by user ":

+(c{F|, = +(xyy

, \+(,

For each symptom ; ∈ +(c{F|, , we consider the relevance level to the set of user chosen symptoms +(, in following way. Suppose that, the set of conditions in b(, related to symptoms ; is bj = {9C, 9D, . . ., 9~}. For each condition 91 ∈ bj we have respectively symptoms set +od. Let M1 = |+od ∩ +(

, |is the number of symptom in +(, which related to

condition 91. Actually, symptom ; can be related directly to the symptoms in +(,by difference ways (by some 91 ∈ bj). Therefore, the relevance level between ; ∈ +(c{F|, and +(, notated as s?=?GH79?(;, +(,) is a sequence as follows:

s?=?GH79?(;, +(,) = {(9C, MC), (9D, MD), . . . , (9~, M~)}

We need to transform s?=?GH79?(;, +(,)to a scalar ;98:?(;, +(,) for ranking symptoms in +(c{F|, and then making suitable symptom suggestion for user. ;98:?(;, +(,) is defined as:

;98:?(;, +(,) = =8<{(1 + ℎ) ∗ 5HÄCÅ1Å~{M1}

in which H is a constant with defined value.

Symptom ; with higher ;98:?(;, +(,) is ranked higher.

The pictures below show how Symptoms Suggestion working in Healthkee:

Page 22: CÔNG TRÌNH DỰ THI GIẢI THƯỞNG “SINH VIÊN ... · Inverted Index 13 2.2.2. Ranking results with a search query 14 2.3. Data Structures 15 ... using a search engine like

21

Picture: A accuracy case of symptoms suggestion (see case 20 in Appendix 2)

2.6. Personalization and Recommendation

2.6.1. Medical articles crawling

We use jsoup25 latest version 1.8.3 to crawl over 150 thousand articles from 20 well-known newspapers that have medical category (see Appendix 1 for details). Data after crawling is stored in the MySQL database for further usage. This process is installed as a cron job which can run daily, crawl and update newest data into database.

2.6.2. LDA model estimation

Latent Dirichlet allocation (LDA) is a generative statistical model that allows sets of observations to be explained by unobserved groups that explain why some parts of the data are similar.

In this research, we use jGibbsLDA26, an open source java implementation of Latent Dirichlet Allocation using Gibbs sampling technique for parameter estimation and inference. We use jGibbsLDA for mining health topics from text documents was crawled and stored in our database and then use these topics for personalization. This tool is really fast and is designed to analyze hidden/latent topic structures of large-scale datasets. It contains two main features:

25 "jsoup Java HTML Parser, with best of DOM, CSS, and jquery." 2009. 21 Mar. 2016 <http://jsoup.org/> 26 "GibbsLDA++: A C/C++ Implementation of Latent Dirichlet Allocation” - Xuan-Hieu Phan, Cam-Tu

Nguyen <http://gibbslda.sourceforge.net/>

Page 23: CÔNG TRÌNH DỰ THI GIẢI THƯỞNG “SINH VIÊN ... · Inverted Index 13 2.2.2. Ranking results with a search query 14 2.3. Data Structures 15 ... using a search engine like

22

● Estimate LDA model: Generate the LDA model from the collection of documents. It provides options for saving model at specified steps and continue estimate/inference from current step.

● Inference new documents: Use the generated model to inference the topics distribution of new input documents.

Before using the jGibbsLDA tool, we do a pre-process for the collection of documents. We use words segmentation for all documents by using JVnTextPro27, then remove all stopwords is not related to any health topics such as “nhưng, và, cũng, etc..”. The stopwords list is collected from the Internet. But we recognize that some characteristic in medical stopwords is not appear on this list, so we calculate words frequency of input data, choose appeared several times words and manually remove them from our corpus. It helps increasing accuracy of jGibbsLDA’s result.

Fig. 8: Some normalized input data

Fig. 9: Some topics was extracted from our result 27 "JVnTextPro - A Java-based Vietnamese Text Processing Tool <http://jvntextpro.sourceforge.net/>

Page 24: CÔNG TRÌNH DỰ THI GIẢI THƯỞNG “SINH VIÊN ... · Inverted Index 13 2.2.2. Ranking results with a search query 14 2.3. Data Structures 15 ... using a search engine like

23

2.6.3. Similarity calculation

We defined a data structure called User’s Topics of Interest (_8^) in section 2.3.1.3. For a user u, we have _8^( = {(!C, 0C), (!D, 0D), . . . }. With articles we also define a data structure for each article as _8Ç1 = {(!C, 0C), (!D, 0D), . . . }, in which !1is the i-th topics referred by LDA Model and 01is the weight of that topic.

We find the most related articles for a user " by calculation distance between two weight distributions of topics of that user will all articles in the system to find closest ones. We used LK-distance (Kullback–Leibler divergence) which is mainly used in probability theory and information theory to measure of the difference between two probability distributions. For discrete probability distributions P and Q, the Kullback–Leibler divergence12 of Q from P is defined as

Let "É = {01|(!1, 01) ∈ _8^(}, HÉ = {01|(!1, 01) ∈ _8Ç}. With user "and a set of [ medical articles Ç = {HC, HD, HÑ, . . . , HY}, we calculate the similarity between "and an article H1 by the following formula:

2.6.3. Recommendation system

We can describe our recommendation system with Fig. 10:

Page 25: CÔNG TRÌNH DỰ THI GIẢI THƯỞNG “SINH VIÊN ... · Inverted Index 13 2.2.2. Ranking results with a search query 14 2.3. Data Structures 15 ... using a search engine like

24

Fig. 10: Workflow for Healthkee‘s recommendation system

Fig. 11. Database schema for Healthkee’s recommendation system

Page 26: CÔNG TRÌNH DỰ THI GIẢI THƯỞNG “SINH VIÊN ... · Inverted Index 13 2.2.2. Ranking results with a search query 14 2.3. Data Structures 15 ... using a search engine like

25

The recommendation system includes three parts: - Content construction: We crawl healthcare articles from well-known

newspapers like Health and Life28, dieutri.vn29 , etc. After that, we do some post-process such as cleaning data, word segmentation to uptraing LDA model (if needed) or do inference for new data. The crawler is set to run periodically (1-2 times per day).

- Calculation module: - With new users or guests (topics column have no information), the

system will return newest articles in the system. - When user interacts with the system, actions will be recorded then

send to server, then be analyzed using LDA++ to update the topics value of that user. (see section 2.6.3).

- Based on the topics value of users and articles, we proceed to calculate the similarity between them using KL-distance (see section 2.6.3), then update personal_dashboard_objects table (the table that contains the object will push the user's feed).

- Worker: A process running on the server periodically to scan too old record in table personal_dashboard_objects to remove. This helps user always having the updated articles.

The pictures below demonstrates how the recommendation system works in Healthkee:

28 Health and Life Newspaper is official portal for Ministry of Health. 29 Dieutri.vn is a famous newspaper for internal communication purposes, self-posting and exchanging

feedback and mutual learning among university students medicine, doctors and pharmacists or graduate student.

Page 27: CÔNG TRÌNH DỰ THI GIẢI THƯỞNG “SINH VIÊN ... · Inverted Index 13 2.2.2. Ranking results with a search query 14 2.3. Data Structures 15 ... using a search engine like

26

Picture :Healthkee’s recommendation system in action

2.7. Evaluation and Analysis

We collect 45 real, well-documented cases to test our symptom checker (see full lists at Appendix 2). We use our symptom checker to input symptoms then get the results to compare with case’s outputs. Table 1 shows the result:

Number of correct cases

Top 2 18/45

Top 5 28/45

Do not appear in output 6/45

Table 1: Symptom checker evaluation

Overall, the correct diagnosis was listed first in 40% cases and top 5 in 62% cases. In some cases (6/45), the symptom checker can not find the correct condition. The result is promising but we still have to improve the algorithm and database to make to symptom checker more accuracy.

III. Conclusions and Future Works

Healthkee is a personal smart health assistant application. It was created with the mission is to make your health better. We want you to get healthy faster and stay healthy

Page 28: CÔNG TRÌNH DỰ THI GIẢI THƯỞNG “SINH VIÊN ... · Inverted Index 13 2.2.2. Ranking results with a search query 14 2.3. Data Structures 15 ... using a search engine like

27

for longer by giving you personalized health information. Healthkee is always with you and ready to tell you what your possible condition are when you have symptoms. Furthermore, Healthkee is a bank of health information which is always open.

The first problem we encountered was the problem of collecting and building data. Data sources in medical and health care in Vietnam are very limited and almost unverified. On the other hand, Healthkee cannot play the role of doctor. The information that it provides is only for reference purposes.

In health care, everyone is careful to approach something new because of the reliability of information, the security of personal information. This is one of our obstacles and difficulties. We want to extensively deploy applications to users, get their feedback to improve our system.

Our system still in early stage and has been developing and improving step by step. We have a lot of work to do next. The improving database is a vital problem of our system. In VietNam there is no authentic data source in medical field and health care. We will continue to collect data from different sources, invite expert to validate and edit data with the goal of making valuable data for Vietnamese. Our aim is become a health information portal for Vietnamese. We are also studying on new models to apply to the main issues such as diagnosis supporting, symptoms suggestion and user personalization.

Page 29: CÔNG TRÌNH DỰ THI GIẢI THƯỞNG “SINH VIÊN ... · Inverted Index 13 2.2.2. Ranking results with a search query 14 2.3. Data Structures 15 ... using a search engine like

28

IV. References

1. Barnett, G Octo et al. "DXplain: an evolving diagnostic decision support system." Jama 258.1 (1987): 67-74.

2. Aronson, Alan R. "DiagnosisPro: the ultimate differential diagnosis assistant." JAMA 277.5 (1997): 426-426.

3. Shortliffe, Edward. Computer-based medical consultations: MYCIN. Edward Shortliffe. Elsevier, 2012.

4. Fox, Susannah, and Maeve Duggan. "Pew Internet and American Life Project." Health online 2013 (2013).

5. Tang, Hangwi, and Jennifer Hwee Kwoon Ng. "Googling for a diagnosis—use of Google as a diagnostic aid: internet based study." BMJ 333.7579 (2006): 1143-1145.

6. Taubert, Mark et al. "Use of Google as a diagnostic aid." British Medical Journal 7581 (2006): 1270.

7. Luger, Tana M, Thomas K Houston, and Jerry Suls. "Older adult experience of online diagnosis: results from a scenario-based think-aloud protocol." Journal of medical Internet research 16.1 (2014): e16.

8. North, Frederick et al. "Should you search the Internet for information about your acute symptom?." Telemedicine and e-Health 18.3 (2012): 213-218.

9. Wyatt, Jeremy C. "Fifty million people use computerized self triage." 351 (2015): h3727.

10. "Leading Consumer Health Technology, ITriage, Launches Enhanced Symptom Checker." ITriage. Web. 21 Mar. 2016.

11. Semigran, Hannah L et al. "Evaluation of symptom checkers for self-diagnosis and triage: audit study." 351 (2015): h3480.

12. MacKay, David JC. Information theory, inference and learning algorithms. Cambridge university press, 2003.

Page 30: CÔNG TRÌNH DỰ THI GIẢI THƯỞNG “SINH VIÊN ... · Inverted Index 13 2.2.2. Ranking results with a search query 14 2.3. Data Structures 15 ... using a search engine like

29

V. Appendix

Appendix 1: Articles in medical from 20 well-known newspapers

Source Number of articles

http://afamily.vn 2717 http://alobacsi.com 5522 http://bacsinoitru.vn 167

http://blogsuckhoe.com 11683 http://dantri.com 4472

http://dongyvietbac.com.vn 627 http://edoctor.vn 6251

http://giaoduc.net.vn 2124 http://infonet.vn 5111

http://kenhsuckhoe.vn 2057 http://khoahoctv.vn 11298

http://soha.vn 1981 http://suckhoedoisong.vn 17378

http://suckhoegiadinh.com.vn 549 http://suckhoetonghop.com 2633

http://thanhnien.vn 2006 http://vietbao.vn 68667

http://vov.vn 2456 https://wikimed.vn 3547 http://news.zing.vn 1494 Total: 20 sources Total: 152740 articles

Appendix 2: 45 cases using to evaluate symptom checker

Page 31: CÔNG TRÌNH DỰ THI GIẢI THƯỞNG “SINH VIÊN ... · Inverted Index 13 2.2.2. Ranking results with a search query 14 2.3. Data Structures 15 ... using a search engine like

30

No Diagnosis Vignette Simplified Result*

1 Trầm cảm

Bệnh nhân nam, 72 tuổi, thường xuyên có triệu chứng kích động và gây gổ, vời kèm theo tâm trạng buồn chán. Có tiền sử bị mất trí nhớ tuổi già, lipid trong máu cao, bệnh động mạch vành, can thiệp động mạch vành và thay van động mạch chủ. Bệnh nhân được điều trị bằng giao tiếp, trò chuyện thêm vào đó lá dùng thuốc chống trầm cảm.

Hay kích động, và tâm trạng chán nản

1

2 Bệnh gút

Bệnh nhân nam 50 tuổi có biểu hiện xuất hiện đau và sưng nhanh ở ngón chân phải. Ông ấy đã bị đau trước đo 4-5 ngày và được điều trị tại khoa cấp cứu. Tiền sử bị huyết cao và được điều trị bằng thuốc Hydrochlorothisazide.

Sưng và đau ngón chân phải

1

3 Bệnh viêm dạ dày

Bệnh nhân nam 42 tuổi bị đau bụng, đầy bụng và buồn nôn. Xét nghiệm ure trong hơi thở thì dương tính với vi khuẩn Heli P.

Đau bụng, buồn nôn, đầy bụng.

7

4 Bệnh viêm ruột thừa

Bệnh nhân nam 21 tuổi, bị đau bụng đột ngột, và nhói vào khoa cấp cứu. Buồn nôn và nôn, đau phía bên hố chậu phải gần vị trí rốn. Anh không ăn 48 tiếng đồng hồ. Da khô, và thiếu nước.

Đau bụng đột ngột, nhói, nôn và buồn nôn, đau hố chậu, da khô, thiếu nướ.

5

5 Cúm thông thường

Bệnh nhân nam, 35 tuổi, cảm thấy mệt vài ngày gần đây, bị tắc mũi ra dịch màu vàng, ho không đờm bắt đầu từ sáng nay. Không sốt. Được điều trị kháng sinh.

Mệt mỏi, ho, tác mũi, có dịch ra từ mũi.

1

6 Trào ngược thực quản dạ dày

Bệnh nhân nam 34 tuổi vào viện vì gia đình nghe giọng anh ấy giống như khàn, anh ấy phải thường xuyên làm sạch họng. Anh ấy bị gần môt năm rồi, đi khám sức khỏe sáu tháng một lần thì bình thường. Anh ấy có ợ chua và thường xuyên ợ hơi. Có tiền sử gia đình bị ung thư thực quản.

Khàn giọng, ợ hơi, ợ chua. Tiền sử gia đình bị ung thư thực quản.

1

7 Viêm amidan Bệnh nhân nam 24 tuổi, không hút thuốc, không uống rượu. bị đau, rát họng, có sốt. Anh ấy tự dùng thuốc ALVEDON 500 mg, sau đó không đỡ anh nhập viện.

Sốt, đau và rát họng. 11

8 Bệnh loãng xương

Bệnh nhân nữ 52 tuổi bị đau xương nhiều năm sau khi mãn kinh. Cô ấy từng bị gãy xương hông trái và cổ tay trái. Đau dữ dội và không làm được các hoạt động thường ngày. Cô ấy sử dụng vitamin E 400 IU một ngày và thực phẩm chức năng. Khám cho thấy đốt sống cổ, ngực và lưng bị đau khi chạm vào và hạn chế vận động. Gia đình có tiền sử bị lo âu, loãng xương, huyết áp cao, tiểu đường.

đau xương, khó khăn vận động, đau cột sống.

10

9 Bệnh Alzheimer

Bệnh nhân nữ 69 tuổi có triệu chứng hay quên. Bà ấy gặp vấn đề về nhớ tên, vị trí của chìa khóa, một số vật dụng. Bà ấy có tiền sử bị bệnh về viêm khớp nên uống thuốc bổ sung canxi mỗi ngày và liều thấp của thuốc tuyến giáp. Gia đình có người bị bệnh mất trí nhớ tuổi già. 20 tháng trở lại đây bệnh nhân suy giảm trí nhớ và thấy xấu hổ.

Trí nhớ giảm, hay quên, thường xuyên xấu hổ vì quên. Gia đình có người bị mất trí nhớ do tuổi già.

3

10 Động kinh Bé gái 5 tuổi, có hiện tượng co giật từ một tháng trước. Bé đột ngột dừng các hoạt động chơi lại khoảng 10 giây, và co giật rồi sau đó thì tỉnh táo trở lại. Mắt bé mở trong

Chân tay co giật, không cử động được, vận động không tự

1

Page 32: CÔNG TRÌNH DỰ THI GIẢI THƯỞNG “SINH VIÊN ... · Inverted Index 13 2.2.2. Ranking results with a search query 14 2.3. Data Structures 15 ... using a search engine like

31

cơn và không thể cử động, tay chuyển động lờ đờ. chủ, bất thường, mắt mở.

11 Suy hô hấp cấp

Bệnh nhân nữ 23 tuổi vào buổi sáng bị nôn, tiêu chảy, ớn lạnh, đau đầu, sốt 40 độ. Triệu chứng diễn ra cả ngày và cô ấy phải nhập viện.

Ớn lạnh, tiêu chảy, buồn nôn, nôn, sốt cao.

17

12 Tiêu chảy

Bệnh nhân nữ 38 tuổi, điều trị ung thư cổ tử cung. Tuy nhiên, sau 3 năm điều trị bệnh nhân xuất hiện các triệu chứng đi đại tiện thường xuyên 3-6 lần mỗi ngày, rất hay đi đại tiện, đau bụng dữ dỗi.

Đau bụng, đại tiện thường xuyên, thường có cảm giác muốn đi đại tiện.

Not found

13 Xuất huyết tiêu hóa

Bệnh nhân nam 45 tuổi, nhập viện do đại tiện phân đen, choáng váng. Ông ấy rất mệt mỏi, và đau bụng hàng năm trời. Ông ấy uống NSAID để giảm đau lưng. Ông ấy có tiền sử bị huyết áp cao.

Phân đen, choáng váng, mệt mỏi, đau bụng.

1

14 Trĩ

Bệnh nhân nam 63 tuổi, bị táo bón thường xuyên, phân có màu, chảy máu trực tràng. Lúc vào viện tỉnh, có tiền sử huyết áp cao điều trị gần 20 năm. Uống Adalat LA 30mg mỗi ngày.

Thường xuyên táo bón, chảy máu hậu môn, phân có màu.

2

15 Xơ gan

Một người đàn ông châu Á bị xơ gan do biến chứng viêm gan. Ông ấy bị yếu toàn thân, nước tiểu màu nâu vàng, đột nhiên sút 8kg trong 3 tuần. Xuất hiện chướng bụng, siêu âm thấy gan to, bàng quang đầy, lách to.

Sút cân nhanh, yếu toàn thận, nước tiểu thậm màu nâu, chướng bụng, gan to, lách to

5

16 Suy tim

Bệnh nhân 68 tuổi, có triệu chứng thở nông, mỗi ngày uống 40mg frusemide lợi tiểu vào buổi sáng được một năm trời. Khám thấy rối loạn chức năng co bóp tâm trương.

Thở nông 3

17 Sỏi thận

Bệnh nhân 32 tuổi, bị đau một bên lưng dưới. Sau đó, bệnh nhân đau hơn và thấy buồn nôn. Đau lan dần sang bụng dưới và háng. Bệnh nhân chụp x-quang bụng, và các xét nghiệm cơ bản khác.

Đau một bên, đau lưng dưới, đau bụng dưới, đau háng, buồn nôn.

1

18 Bệnh cường giáp

Bệnh nhân nữ 31 tuổi, bị tiền sử lupus 10 năm. Hai năm trước, cô ấy

19 Viêm khớp dạng thấp

Bệnh nhân nữ 53 tuổi có triệu chứng sưng, cứng và đau khớp, thường xuyên tê và ngứa ran ở tay, cổ tay, khuỷu tay.

Sưng khớp, đau khớp, cứng khớp, tê tay, cổ tay, khuỷu tay, ngứa ran ở tay, cổ tay, khuỷu tay.

1

20 Hen suyễn

Bệnh nhân nữ 44 tuổi thường bị các cơn khò khè, thở nông, trong 2 năm qua. Cô ấy bị ho và khó thở. Ngày còn nhỏ cô ấy bị dị ứng, mẹ và anh họ cô ấy bị hen suyễn. Cô ấy hút 10 điếu thuốc mỗi ngày.

Khó thở, thở nông, khò khè, ho, dị ứng, hút thuốc

1

21 Đột quỵ

Bệnh nhân 52 tuổi, có tiền sử huyết áp cao, và hút thuốc khi đang ăn tối với vợ thì đột ngột thấy khó nói, miệng bên trái bị rũ xuống, yếu tay trái. Qua 10 phút cho tới khi tay anh ấy không thể cử động được và không đứng được. Bệnh nhân được đưa đi cấp cứu.

Khó nói, miệng bị rũ xuống, yếu tay, yếu người, không đứng được, gặp vấn đề về cử động, huyết áp cao.

1

22 Viêm phổi Bệnh nhân nam 68 tuổi, nhập viện vì ho và khó thở một tuần. Được kê đơn azithromycin nhưng không cải thiện

Ho có đờm, khó thở, ớn lạnh, sốt, bị

3

Page 33: CÔNG TRÌNH DỰ THI GIẢI THƯỞNG “SINH VIÊN ... · Inverted Index 13 2.2.2. Ranking results with a search query 14 2.3. Data Structures 15 ... using a search engine like

32

sau 3 ngày. Có tiền sử bị COPD, xơ gan do rượu, rối loạn lipid máu. Anh ấy thường sốt cao, ớn lạnh, ho thỉnh thoảng có đờm, khó thở.

COPD trước đó.

23 Viêm phế quản cấp tính

Bệnh nhân nữ về hưu 60 tuổi, 3 ngày trước bị viêm mũi có mủ, ho có đờm. Không bị thở nông. Bà ấy bị hen suyễn hồi con nhỏ, không hút thuốc.

Ho có đờm, viêm mũi có mủ. Bị hen suyễn khi còn nhỏ.

Not found

24 Bệnh đau mắt đỏ

Bệnh nhân nam 11 tuổi, 4 ngày bị kích ứng và ngứa mắt 4 ngày, đầu tiên là mắt trái rồi một ngày sau cả 2 mắt. Cả hai mắt đều có dịch vàng ra, khó mở mắt vào buổi sáng. Không sử dụng thuốc nhỏ mắt. Không có tiền sử về mắt, không đeo kính áp tròng.

Kích ứng mắt, dịch vàng từ mắt, ngứa mắt.

2

25 Tăng nhãn áp Bệnh nhân 67 tuổi, nam, có triệu chứng thấy điểm đen ở mắt trái, nhìn mờ phía ngoài mắt. Và cũng thấy lóe sáng bên mắt phải.

Thấy điểm đen ở mắt,nhìn mờ, thấy lóe sáng mắt phải.

6

26 Viêm da cơ địa

Bé trai 7 tháng tuổi, bị nổi ban đỏ có mủ, mẹ bé cho biết bé bị từ lúc 4 tháng tuổi, tập trung chủ yếu ở má, xung quanh mồm. Bé thường xuyên gãi vị trí bị.

nổi ban, có mủ, dịch, nổi mẩn ở má, mồm, ngứa gãi.

2

27 Chửa ngoài tử cung

Bệnh nhân nữ 27 tuổi, vừa mới sẩy thai, đến phòng cấp cứu, có triệu chứng đau nhói bụng dưới bên trái, và đau vai. Mang thai 7 tuần. Chóng mặt và yếu mệt, da xanh, bụng cứng.

đau nhói bụng dưới trái, đau vai, chóng mặt, yếu, da xanh, bụng cứng.

6

28 Lơcemi Bệnh nhân nam 41 tuổi bị mệt mỏi, chảy máu lợi, thở nông, Sau khi đến khám, bạch cầu của bệnh nhân là 40.000 tế bào/mm3.

Mệt mỏi, chảy máu lợi, thở nông, ngắn.

2

29 Thiếu máu do thiếu sắt

Bệnh nhân nữ 17 tuổi, bị mệt mỏi, thường xuyên chóng mặt.

Mệt mỏi, chóng mặt. 1

30 Suy giáp

Bệnh nhân nữ 51 tuổi chẩn đoán bị suy giáp một năm, uống 25mcg thuốc mỗi ngày. Bệnh nhân có triệu chứng tăng cân, mệt mỏi, da khô, tóc và móng tay khô. Thường xuyên bị cảm, nhiễm trùng đau răng, lợi. Ngoài ra còn đau đầu, dạ dày khó chịu.

Tăng cân, khô da, mệt mỏi, khô tóc, hay nhiễm trùng, thường bị cảm, đau răng, lợi, đau đầu, dạ dày khó chịu.

4

31 Viêm xoang cấp

Bệnh nhân nữ 26 tuổi, có triệu chứng dịch có màu ra từ mũi, đau đầu, lơ mơ, khò khử. Cô ấy thường uống thuốc giảm đau paracetamol. Sau đó đi khám cô ấy dùng kháng sinh và thấy đỡ hơn. Cô ấy thấy mệt mỏi, thường xuyên run rẩy, mũi thì phập phồng.

Đau đầu, lơ mơ, khò khử, có dịch ra từ mũi, mệt mỏi, mũi phập phồng.

11

32 Tự kỷ

Bé trai 10 tuổi, có hạn chế về kỹ năng ngôn ngữ. giao tiếp chậm, ít thường xuyên chỉ. Hành vi tự làm một mình như nhặt đá, gập tay, vỗ tay. Bị động kinh từ khi 2 tuổi, có uống thuốc động kinh.

Hành vi lặp lại, kỹ năng ngôn ngữ kém, co giật.

2

33 Sốt xuất huyết Dengue

Bé trai 13 tuổi, vào viện vì đau bụng, đau đầu sốt, da đỏ bừng, có nôn. Một vài giờ sau thấy ớn lạnh. Trong lúc sốt, anh ấy được mẹ cho uống Paracetamol để giảm sốt.

đau bụng, đau đầu, sốt, da đỏ bừng, nôn, ớn lạnh.

Not found

34 Viêm tụy cấp

Bệnh nhân nữ 88 tuổi có xuất hiện triệu chứng chính là buồn nôn, nôn và đau bụng. Khi khám bụng thì có dấu hiệu đau khi chạm vào. Bà được làm xét nghiệm và truyền dịch Dextrose nomal saline.

Buồn nôn và nôn, đau bụng, đau khi chạm vào.

Not found

34 Tắc mạch phổi Bệnh nhân nam 80 tuổi đi khám, vì cách đây 3 ngày bị Đau đột ngột phía Not

Page 34: CÔNG TRÌNH DỰ THI GIẢI THƯỞNG “SINH VIÊN ... · Inverted Index 13 2.2.2. Ranking results with a search query 14 2.3. Data Structures 15 ... using a search engine like

33

đau phía xương sườn phải khi nằm ngửa người, đau đột ngột, bị táo bón.

xương sườn phải khi nằm ngửa, táo bón mạn tính.

found

35 Loét dạ dày-tá tràng

Bệnh nhân vào viện vì đau bụng, yếu, đi đại tiện khó, nôn. Bệnh nhân uống thuốc nhưng không đỡ.

Yếu, đau bụng, đi đại tiện khó, nôn, ợ nóng.

14

36 Viêm âm đạo

Bệnh nhân nữ 24 tuổi, vào viện vì có dịch vàng, có mùi ra từ âm đạo và khó đi tiểu khoảng một tuần. Khoảng sáu tháng trở lại đây cô ấy quan hệ với 2 người nhưng không sử dụng bao cao su. Khám dấu hiệu sinh tồn và nhữngbộ phận khác hoàn toàn bình thường.

Dịch âm đạo vàng và có mùi, khó đi tiểu.

1

37 Bệnh lupus ban đỏ hệ thống

Bệnh nhân nữ 33 tuổi nhập viện do khó thở, ngứa và khó đi tiểu, phù ngoại vi. Ngoài ra bệnh nhân còn đau lưng và ngứa, đau bụng, da vàng.

Khó thở, ngứa và khó đi tiểu, đau bụng, da vàng, phù ngoài bi.

Not found

38 Phì đại tuyến tiền liệt

Bệnh nhân nam 66 tuổi vào viện vì đau và nhói ở đường tiểu dưới nhiều ngày. Các dấu hiệu sinh tồn khác hoàn toàn bình thường. Không hút thuốc cũng không dị ứng với thuốc điều trị.

Đau dữ dội và đau nhói đường tiểu dưới.

Not found

39 Nhiễm trùng đường tiểu

Bệnh nhân nữ 82 tuổi, hay tiểu không tự chủ, thường tiểu đêm.

Tiểu không tự chủ, tiểu đêm.

2

40 Sỏi mật Bệnh nhân nữ 72 tuổi, đau bụng trên, nôn.. Có tiền sử viêm khớp dạng thấp. Nhập viện 2 tháng trước do nhiễm trùng đường tiểu.

Đau bụng trên, nôn. 1

41 Viêm họng Bệnh nhân nữ 15 tuổi, bị lơ mơ 3 ngày và rát họng bắt đầu hôm nay, khó nuốt đồ ăn cứng. Không sốt, sưng amidan,có dịch. Không bị dị ứng thuốc, không sốt.

lơ mơ, rát họng, khó nuốt

9

42 U nang buồng trứng

Bệnh nhân nữ 17 tuổi, vào phòng cấp cứu được chấn đoán u nang buồng trứng khi đi siêu âm sáu tuần trước. Có dấu hiệu đau bụng dưới bên trái, và đau lưng dưới phía ngoài, cách đây 2 tháng. Có tiền sử hen suyễn.

Đau bụng dưới, đau một bên, đau lưng dưới một bên.

4

43 Viêm phúc mạc

Bệnh nhân nữ 26 tuổi, điều trị tiểu đường, 13 năm nay, dẫn tới suy thận và mù. Cô ấy cũng bị huyết áp cao và béo phì. Cô ấy nhập viện vì sốt, ớn lạnh, viêm mô tế bào bụng. Bị loét vùng da và có dịch vàng.

Sốt, ớn lạnh, viêm mô tế bào bụng

12

44 Viêm mũi dị ứng

Bệnh nhân nữ 14 tuổi, xuất hiện ho vào buổi tối, và gây ngủ gà ban ngày. Nước mũi thường xuyên chảy và bị tắc vào ban đêm khiến cô ấy khó ngủ. Mắt đỏ, ngứa thường có nước mắt trong ra. Bố cô ấy bị hen suyễn và viêm mũi dị ứng. Mẹ bị viêm mũi dị ứng và chàm.

Họ vào buổi tối, ngủ gà, chảy nước mũi, tắc mũi, mất ngủ, ngứa và đỏ mắt, thường xuyên có nước mắt ra. gia đình có cha và mẹ bị viêm mũi dị ứng.

3

45 Viêm tai giữa Bé trai năm tháng tuổi, bị sốt, ho rất nhiều, bị chảy nước mũi và cảm. Bé được kê kháng sinh và khám lại sau 2 tuần.

Ho, chảy nước mũi, cảm

5

(*) Position of diagnosis condition in the results outputted by Healthkee

Page 35: CÔNG TRÌNH DỰ THI GIẢI THƯỞNG “SINH VIÊN ... · Inverted Index 13 2.2.2. Ranking results with a search query 14 2.3. Data Structures 15 ... using a search engine like

34

Sources of 45 cases 1 http://www.hopkinsmedicine.org/gec/studies/depression_dementia.html

2 http://www.ukessays.com/essays/nursing/case-study-of-diagnosis-and-treatment-of-gout-nursing-essay.php

3 http://bestpractice.bmj.com/best-practice/monograph/816/diagnosis/case-history.html

4 http://journals.rcni.com/doi/pdfplus/10.7748/ns2013.06.27.42.35.e7584

5 http://www.slideshare.net/lilirios44/common-cold-presentation

6 http://www.medscape.org/viewarticle/573475

7 http://vi.scribd.com/doc/64123290/Case-Study-Tonsillitis#scribd

8 http://nursing.advanceweb.com/Article/Osteoporosis-Case-Study.aspx

9 http://www.stacommunications.com/customcomm/Back-issue_pages/AD_Review/adPDFs/march1998/18.pdf

10 American Epilepsy Society

11 https://prezi.com/zwvtjsfwna5n/case-study-acute-respiratory-distress-syndrome/

12 http://www.medscape.com/viewarticle/776367_8

13 http://www.meddean.luc.edu/lumen/meded/mech/cases/case10/Caseqa_f.htm

14 http://vi.scribd.com/doc/5038008/HEMORRHOID-case-study#scribd

15 http://pharmacologyonline.silae.it/files/casereport/2014/vol3/PhOL_2014_3_CR003_Rashad_13_16.pdf

16 http://www.nps.org.au/__data/assets/pdf_file/0008/35459/Case_8_results.pdf

17 http://www.mhhe.com/biosci/ap/saladin/student/olc/chap20casestudies.html

18 http://www.chiro.org/alt_med_abstracts/ABSTRACTS/A_Case_Report_of_a_53.pdf

19 http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2774375/

20 http://tigger.uic.edu/com/ferne/pdf/iacs0501.pdf

21 http://www.testtargettreat.com/en/home/educational-resources/case-studies/pneumonia-case-study.html

22 http://www.nps.org.au/__data/assets/pdf_file/0009/35388/Case_20_results.pdf

23 http://www.mcw.edu/ophthalmology/education/ophthcstudies/Case2.htm

24 http://www.ophthalmologymanagement.com/articleviewer.aspx?articleid=86320

25 http://www.medscape.org/viewarticle/755667

26 http://www2.austin.cc.tx.us/adnlev3/comp_preg_bleeding/Case%20Study-%20Ectopic%20Pregnancy.htm

27 http://www.jhasim.com/files/articlefiles/pdf/ASIN%204_6_NewsPart4_Olsen%20Case.pdf

28 http://www.nps.org.au/__data/assets/pdf_file/0007/114856/Case-study-66-report.pdf

29 http://www.thyroiduk.org.uk/tuk/get_involved/case_studies/hypothyroidism_6.html

30 http://www.nps.org.au/__data/assets/pdf_file/0020/167006/Case-study-72-report.pdf

31 https://www.stronginstitute.com/resources/case-studies/autism-case-studies.html

32 http://vi.scribd.com/doc/25370529/21244742-Dengue-Fever-Case-Study#scribd

33 http://www.imperial.edu/admin/Media/File_Upload/40-Files/Rick/Case%20Study/CS%20Pancreatitis%20Miller.pdf

Page 36: CÔNG TRÌNH DỰ THI GIẢI THƯỞNG “SINH VIÊN ... · Inverted Index 13 2.2.2. Ranking results with a search query 14 2.3. Data Structures 15 ... using a search engine like

35

34 http://www.natfonline.org/media/22710/august-09kiderman.pdf

35 http://vi.scribd.com/doc/38622470/Peptic-Ulcer-Disease#scribd

36 www2a.cdc.gov/.../Vaginitis/vaginitis-case-study-2013.do.

37 http://www.academia.edu/10202179/Case_Study_Systemic_Lupus_Erythematosus_Lupus_Nephritis

38 http://www.omicsonline.org/open-access/alpha-blocker-to-prostatectomy-a-patient-with-benign-prostatic-hyperplasia-a-case-report-.pdf

39 http://www.nps.org.au/health-professionals/cpd/activities/case-studies/urinary-tract-infections-exploring-antibiotic-treatment

40 http://www.nature.com/nrgastro/journal/v2/n7/full/ncpgasthep0211.html

41 http://www.nps.org.au/__data/assets/pdf_file/0012/35400/Case_26_results.pdf

42 http://www.consultant360.com/articles/giant-ovarian-cyst-adolescent-pcos

43 http://path.upmc.edu/cases/case93.html

44 http://www.gponline.com/case-study-hayfever-adolescent/allergic-disorders/allergic-rhinitis/article/1295564

45 http://www.mhhe.com/biosci/ap/saladin/student/olc/chap12casestudies.html