• 제목/요약/키워드: Subject Classification

검색결과 816건 처리시간 0.025초

관절면을 침범한 경골 외과 골절의 관절경적 정복 및 내고정술 (Arthroscopic Reduction and Internal Fixation of Intra-articular Fractures of Lateral Tibial Plateau)

  • 이광원;이항호;양동현;최원식
    • 대한관절경학회지
    • /
    • 제10권1호
    • /
    • pp.53-60
    • /
    • 2006
  • 목적: 본 연구는 관절면을 침범한 경골 외과 골절 환자의 관절경적 정복 및 내고정술 후 임상 결과와 방사선적 결과를 분석하고자 하였다. 대상 및 방법: 2000년 3월에서 2004년 8월까지 본원 정형외과를 방문한 관절면을 침범한 경골 외과 골절 환자 중 관절경적 정복 및 내고정술을 시행한 13례를 대상으로 하였다. 정확한 골절의 양상 및 함몰의 정도를 파악하기 위하여 단순 방사선 사진 및 전산화 단층 촬영 또는 자기 공명 영상 촬영을 같이 시행하여 분석한 Schatzker 골절 분류상 전례가 제 2형에 해당하였으며, 9례에서는 골결손이 심하여 자가골 및 동종골을 이용한 골이식을 시행하였다. 평균 연령은 $48(31{\sim}66)$세였고, 평균 추시기간은 $38(13{\sim}65)$개월이었다. 동반손상은 후방 십자 인대 손상 1례, 반월상 연골 손상 4례, 내측 측부 인대 손상 2례가 관찰되었다. 방사선학적 평가는 술전, 술후 및 최종 추시시 단순 방사선 사진에서 관절면 정복의 정도를 비교하였고, 기능적 평가는 IKDC 점수와 Lysholm 점수를 후향적으로 분석하였다. 결과: 최종 추시시 단순 방사선 사진상 전례에서 관절면의 정복이 잘 유지되고 있었고, 함몰이나 골절 정복 소실, 각 변형, 부정유합 등의 합병증은 관찰되지 않았다. Lysholm 점수는 평균 $87(65{\sim}97)$점이었고, Lysholm 분류상 우수(exellent) 8례, 양호(good) 3례, 보통(fair) 1례, 불량(poor) 1례이었으며. IKDC 점수는 평균 $92(82{\sim}99)$점이었다. 결론: 경골 외과 골절시 관절경적 정복은 관절면의 정확한 정복을 얻을 수 있을 뿐만 아니라 관절경을 통한 슬관절 동반 손상의 진단 및 치료를 위한 좋은 술식으로 사료된다.

  • PDF

토픽모델링을 활용한 국내 문헌정보학 연구동향 분석 (A Study on the Research Trends in Library & Information Science in Korea using Topic Modeling)

  • 박자현;송민
    • 정보관리학회지
    • /
    • 제30권1호
    • /
    • pp.7-32
    • /
    • 2013
  • 본 연구는 국내 문헌정보학 분야의 연구동향을 규명하기 위하여 문헌정보학 주요 학술지인, 정보관리학회지, 한국문헌정보학회지, 한국도서관 정보학회지, 한국비블리아학회지의 1970년도부터 2012년도까지 발표 논문 초록을 수집하여 LDA(Latent Dirichlet Allocation)기반의 토픽 모델링 실험을 수행하였다. 그 결과를 종합하면 다음과 같다. 첫째, 토픽모델링 실험에서 도출된 연구주제를 문헌정보학 주제분류표와 비교 분석한 결과, '정보학'영역의 디지털도서관, 이용연구, 인터넷, 전문가시스템, 계량정보학, 자동화, 정보검색, 정보시스템, '도서관 서비스'영역의 정보서비스, 도서관 유형별 서비스, 이용자 교육/정보리터러시, 서비스 평가, '문헌정보학 기초'영역의 도서관과 사회, 전문성, '자료조직'영역의 분류, 편목, 메타데이터, '도서관 경영'영역의 도서관 평가, 장서개발/관리, '서지학'영역의 고서지, '도서관 체제'영역의 도서관 및 정보정책, '출판'영역의 도서/출판, '기록관리학'영역의 하위주제 등과 연결할 수 있었다. 또한 가장 많은 연구주제가 발견된 학문영역은 정보학과 도서관서비스로 나타났다. 둘째, 문헌정보학의 주요 연구주제에서 도서관 유형별 서비스 및 평가, 인터넷, 메타데이터의 연구주제는 상승세를 보였으나, 도서, 분류, 편목, 고서지에 관한 연구주제는 하강세를 보였다. 셋째, 학술지를 구분하여 비교 분석한 결과, 정보관리학회지는 도서관에 관한 연구주제보다 정보학에 관한 연구주제가 많이 출현하였고, 한국문헌정보학회지와 한국도서관 정보학회지, 한국비블리아학회지는 도서관에 관한 연구주제가 정보학에 관한 주제보다 많이 나타났다.

Structural SVM을 이용한 백과사전 문서 내 생략 문장성분 복원 (Restoring Omitted Sentence Constituents in Encyclopedia Documents Using Structural SVM)

  • 황민국;김영태;나동열;임수종;김현기
    • 지능정보연구
    • /
    • 제21권2호
    • /
    • pp.131-150
    • /
    • 2015
  • 영어와 달리 한국어나 일본어 문장의 경우 용언의 필수격을 채우는 명사구가 생략되는 무형대용어 현상이 빈번하다. 특히 백과사전이나 위키피디아의 문서에서 표제어로 채울 수 있는 격의 경우 그 격이 문장에서 더 쉽게 생략된다. 정보검색, 질의응답 시스템 등 주요 지능형 응용시스템들은 백과사전류의 문서에서 주요한 정보를 추출하여 수집하여야 한다. 그러나 이러한 명사구 생략 현상으로 인해 양질의 정보추출이 어렵다. 본 논문에서는 백과사전 종류 문서에서 생략된 명사구 즉 무형대용어를 복원하는 시스템의 개발을 다루었다. 우리 시스템이 다루는 문제는 자연어처리의 무형대용어 해결 문제와 거의 유사하나, 우리 문제의 경우 문서의 일부가 아닌 표제어도 복원에 이용할 수 있다는 점이 다르다. 무형대용어 복원을 위해서는 먼저 무형대용어의 탐지 즉 문서 내에서 명사구 생략이 일어난 곳을 찾는 작업을 수행한다. 그 다음 무형대용어의 선행어 탐색 즉 무형대용어의 복원에 사용될 명사구를 문서 내에서 찾는 작업을 수행한다. 문서 내에서 선행어를 발견하지 못하면 표제어를 이용한 복원을 시도해 본다. 우리 방법의 특징은 복원에 사용된 문장성분을 찾기 위해 Structural SVM을 사용하는 것이다. 문서 내에서 생략이 일어난 위치보다 앞에 나온 명사구들에 대해 Structural SVM에 의한 시퀀스 레이블링(sequence labeling) 작업을 시행하여 복원에 이용 가능한 명사구인 선행어를 찾아내어 이를 이용하여 복원 작업을 수행한다. 우리 시스템의 성능은 F1 = 68.58로 측정되었으며 이는 의미정보의 이용 없이 달성한 점을 감안하면 높은 수준으로 평가된다.

농업 기후 지대 구분과 기상 재해 특성 (Agroclimatic Zone and Characters of the Area Subject to Climatic Disaster in Korea)

  • 최돈향;윤성호
    • 한국작물학회지
    • /
    • 제34권s02호
    • /
    • pp.13-33
    • /
    • 1989
  • 농업기후는 적지 적작을 통하여 주어진 기후자원을 최대한 활용한다는 의미에서 더욱 정밀하게 분석되고 평가되어야 한다. 작물 생산의 안정성 증대와 생산비 절감을 도모하기 위해서는 작물별로 농업기후 지대를 구분하여, 지대별로 알맞은 품종과 재배 기술을 도입 실시하는 것이 바람직하다. 농업기후지대 구분은 농업생산을 지배하는 기온, 강수량, 일조, 습도, 바람 등 작물의 생육과 수량에 직접적으로 영향을 미치는 기후요소들을 종합적으로 평가하여 지대를 구분한다. 벼재배를 위한 농업기수지대는 이앙기의 강수량과 한발지수, 생육 유효 온도(15$^{\circ}C$ 이상)의 출현시기와 지속기간(작물기간), 생육 단계별 저온 출현율을 비롯하여 기온, 일조시수 등의 분석과 종합 판단을 통하여 비슷한 지역을 하나의 지대로 묶어 구분한다. 구분된 우리나라의 벼재배 농업기후 지대는 19개 지대로서, (1) 태백고령지대, (2)태백준고령지대, (3)소백산간지대, (4) 노령소백산간지대, (5)영남내륙산간지대, (6) 중북부내륙지대, (7) 중부내륙지대, (8) 소백서부내륙지대, (9) 노령동서내륙지대, (10) 호남내륙지대, (11) 영남분지지대, (12) 영남내육지대, (13) 중서부평야지대, (14) 차령남부평야지대, (15) 남서해안지대, (16) 남부해안지대, (17) 동해안북부지대, (18) 동해안중부지대, (19) 동해안남부지대이다. 한편 작부농계를 위한 농업기후지대는 벼재배 농업기후지대를 바탕으로 하고, 각 지대별로 여름 작물과 겨울 작물을 위한 기후요소들과 전래되어온 작부농계를 고려하여 9개 지대로 구분하였다. 9개의 작부농계 농업기후지대는 (I) 산간고령지대, (II) 산간지대, (III) 중북부내륙지대, (IV)중북부서부해안지대, (V) 중남부서부해안지대, (VI) 경북내륙지대, (VII) 남부내륙지대, (VIII) 남부해안지대, (IX)동해안지대 등이다. 농업기후지대별 농업기상재해의 특성은 벼 이앙기에 한발지수 1.4 이상을 보인 (11) 영남분지지대, 동해안의 북부(17)와 중부(18) 지대 등이 가뭄 상습지로 나타났고, 냉해 위험지대에는 (2)태백준고냉지대가 포함된다. 태풍과 집중호우에 의한 피해가 년평균 4회 이상인 지대는 (10) 호남내륙지대, (15) 남서해안지대, (16) 남부해안지대로서 강수량분포와 태풍 진로와 관계가 깊다. 그 다음으로 년2~3회 풍수재를 입게 되는 지대는 동해안의 (17), (18), (19) 지대인데, 이 지대는 한발, 냉해, 풍수해가 겹친 지대이다.

  • PDF

耳鳴에 관한 임상적 연구 (A Clinical Study of Tinnitus)

  • 최인화
    • 한방안이비인후피부과학회지
    • /
    • 제14권2호
    • /
    • pp.134-145
    • /
    • 2001
  • Introduction: Noises in the ear, whether real or imagined, are called tinnitus. Subjective causes of tinnitus(which is heard only by the patient) are extremely common and the majority of them are treated conservatively. For certain individuals their tinnitus is a major handicap; for others a trivial concern. The most common from of subjective tinnitus is a rushing, hissing or buzzing noise; it is frequently associated with sensorineural heanng loss. The patient may be unaware of the hearing loss, especially if it is a high frequency deficit of moderate severity. The character of the tinnitus may give a clue to the etiology. But the patient often has difficulty in explaining his/her tinnitus in absolute terms, as they have no other tinnitus with which to compare it but their own Tinnitus, like pain, is a subjective state and trying to objectively assess the severity is problematic. Audiological techniques to match subjective loudness to machine-produced noise may offer some help, in that sound intensity matches can bear little correspondence to subjective complaint. In spite of many studies, most patients presently seen complaining of tinnitus are told by their doctors that there is no treatment and that they will have to learn to live with this symptom. Objectives: To perform a clinical analysis of tinnitus and estimate the efficacy of Oriental Medical treatment according to the Byeonjeung(辨證). Subject: We studied 34 patients with complaints of tinnitus who had visited Pundang Cha Oriental Medicine Hospital Department of Otorhinolaryngology from March 1998 to February 2000. All of them had been treated 2 or 3 times a week with acupuncture treatment and had taken herbs according to the Byeonjeung(辨證) method. It was therefore possible for me to know whether their symptoms improved or not. Parameters Observed and Method: We treated them with acupuncture & herb-medication. Sometimes we gave them moxibustion or negative therapy with bloodletting at the acupuncture points(耳門, 聽宮, 聽會). Parameters Observed 1) Distribution of age & sex 2) Chief complaints 3) The sites of tinnitus 4) The quality of tinnitu 5) The duration of disease 6) The problem induced tinnitus 7) Factors increasing disease severity 8) The classification of the Byeonjeung(辨證) 9) The efficacy of treatments Results: 1. Age and sex distribution: The most common occurrence was found in males in their twenties: 6 males($17.7\%$), and in females in their thirties and over sixty: 8 females($23.5\%$). Total patient numbers for men and women were 20 men($58.8\%$), 14 women ($41.2\%$). 2. The most frequent major complaints were hearing disturbances related to tinnitus; and dizziness with tinnitus; each comprising 10 cases($29.4\%$). There were also 7 patients($20.6\%$) with only tinnitus. 3. Tinnitus sites: 13($38.2\%$) said that they felt tinnitus in both ears, equally. In the right ear, 9($26.5\%$), in the left, 6($17.7\%$). 4. The most frequent descriptive symptoms of tinnitus were: humming, hissing, buzzing etc. 5. The duration of disease. 14cases($41.2\%$) had a duration of less than 1 year. 6. 15cases($44.1\%$) complained that it was hard to watch TV or make a phone call because of tinnitus. 10 cases($29.4\%$) complained about depression. 7. Factors increasing severity of tinnitus: ⅰ) fatigue: 18cases($52.9\%$) ⅱ) stress/ tension: 10 cases($29.4\%$) ⅲ) alcohol and tobacco: 5cases($l4.7\%$) 8. Classification through Byeonjeung : ⅰ) 19 cases($55.9\%$) were classified as showing Deficiency syndrome. ⅱ) 15 cases($44.l\%$) were classified as showing Excess syndrome. The deficiency of Qi was 7($20.6\%$), deficiency of Xue, 8($23.5\%$) and insufficiency of the Kidney Yin & Yang, 4($11.8\%$). The flare of Liver fire was 8($23.5\%$) and phlegm-fire, 7($20.6\%$), 9. The efficacy of treatments showed: an improvement in 17cases($50.0\%$); no real improvement or changes in 13 cases($38.2\%$); and some worsening in 4 cases($11.8\%$). In the group with deficiency in Qi, 4($57.1\%$) improved, 1($14.3\%$) showed no change and 2($28.6\%$) were aggravated. In the cases of deficiency in Xue, 6($75.0\%$) improved, 2($25.0\%$) showed no change. In the cases of insufficiency of Kidney Yin & Yang, 3($75.0\%$) showed no change and 1($25.0\%$) were aggravated. In the group of flare of Liver fire, 4($50.0\%$) improved, 3($37.5\%$) no change and 1($12.5\%$) were aggravated. In the cases of phlegm-fire, 3($42.9\%$) improved, 4($57.1\%$) showed no change. Conclusion: We would recommend that any further studies of tinnitus utilize trial treatments of longer than 2 months duration, as any positive effects observed in our study showed that improvement occurred fairly slowly. And we suggest that this study could be utilized as a reference for clinical Oriental Medical treatment of tinnitus. If we try to apply music or sound therapy treatment properly combined with ours, we expect it to provide psycological stability in addition to inducing masking effects, even though it may not directly decrease or completely remove tinnitus.

  • PDF

제주 올레길 생태문화자원 경관생태학적 해석기법 연구 (Interpretation Method of Eco-Cultural Resources from the Perspective of Landscape Ecology in Jeju Olle Trail)

  • 허명진;한봉호;박석철
    • 한국조경학회지
    • /
    • 제49권2호
    • /
    • pp.128-140
    • /
    • 2021
  • 본 연구는 도보관광의 대표적 대상인 제주 올레길의 유형별 대표자원을 대상으로 Landscape Ecology 이론을 적용하여 생태문화적 특성을 파악하였고, 올레길 자원의 경관생태학적 해석 기법을 정립하였다. 제주 올레길 유형분류는 올레길 주변 대표경관, 주요 토지이용, 식생현황을 중심으로 비오톱유형을 조사하여 12개 유형으로 구분하였다. 제주 올레길 도보 관광자원 유형분류는 생태관광 자원분류 유형을 토대로 자연자원 7개 중분류 유형, 인문자원 7개 중분류 유형으로 구분하였고, 각 자원을 경관생태학 구성 체계와 동일하게 Geotope, Biotope, Anthropotope으로 특성화하여 유형별 특성을 파악하였다. Geotope 자원은 해안 및 해변, 바위, 암반, 폭포, 지질 및 주상절리, 오름 및 분화구, 수자원, 지형경관 조망점 등이 해당되어 시각적 경관특성, Biotope 자원은 대경목 및 보호수, 곶자왈, 숲길 및 식생군락지, 생물서식지, 식생경관 조망점 등이 해당되어 생태특성, Anthropotope 자원은 해녀 및 전통문화, 포구 및 등대, 체험시설, 사찰 및 교회, 군사 및 봉수시설, 기타 역사·문화시설, 문화경관 조망점이 해당되어 지역문화 특성이 강하였다. 제주 올레길 유형별 대표자원은 제주에서만 볼 수 있는 해안, 오름, 곶자왈, 밭과 밭담, 제주가옥과 돌담이고, 제주 올레길의 생태문화를 알아보기 위해 올레길 유형을 대표하는 자원들의 구성요소와 다양한 기능들을 경관생태학적으로 해석하였다. 제주 해안의 생태문화적 특성을 살펴보면 해안은 검은 현무암 암반, 해안가 식생, 해안초지, 해안암반 식생, 겨울철새, 제주해녀 등이 있다. 오름은 독특한 화산지형으로 원형과 타원형의 산체, 오름 식생, 분화구 습지, 오름 지명 유래 및 전설, 설문대할망 설화, 말 방목 문화, 군사 목적의 사용, 민간신앙의 대상, 정상에서 조망경관 등이 있다. 곶자왈은 바위 요철 지형, 독특한 미기후 형성, 곶자왈 식생, 지명 유래, 과거 숯을 구웠던 문화, 기이한 형상의 나무와 덩굴식생이 특징이다. 밭담은 밭담구조 및 형태, 밭 재배 농작물, 밭담 서식생물, 제주 농업문화, 밭담경관 등이 있다. 마을은 현무암으로 쌓은 돌담과 지붕구조, 마을 어귀 정자목, 가옥내부 마당과 텃밭, 지역민들의 삶의 모습, 골목길 경관 등이 있다. 이런 자원들은 인간의 오랜 삶과 함께 서서히 변해왔고, 지금은 제주에서만 경험할 수 있는 독특한 경관이 되었다. 자원을 통합적으로 해석하여 특화된 콘텐츠를 제공함으로써 올레를 걷는 도보 관광객들은 자원들의 스토리를 알아가면서 깊이 있게 체험할 수 있고, 올레길의 지속가능한 이용 및 이용객 만족도를 높일 수 있을 것이다.

기록물의 개념과 용어의 정의에 관한 연구 (A Study on the Concept of Records-Archives and on the Definition of Archival Terms)

  • 김정하
    • 기록학연구
    • /
    • 제21호
    • /
    • pp.3-40
    • /
    • 2009
  • 올해로 한국의 기록물관리는 10년을 맞이한다. 그 동안 법, 제도 그리고 교육의 분야에서 괄목할 만한 발전이 있었다. 하지만 빠른 성장의 과정에서 부족한 점도 없지 않았던 것이 사실인데, 그 중에서 가장 근본적인 것은 기록물의 개념에 대한 연구가 충분하지 않았다는 사실이다. 사실 개념에 대한 불충분한 연구는 한국의 경우 기록물에 대한 역사학적 관점, 정보학적 관점 그리고 기록물관리학적인 관점의 무질서한 공존을 초래하였으며 기록물관리가 학문의 한 영역으로 성립하는데 있어 가장 큰 걸림돌이 되고 있다. 역사적으로 'archivium'은 기록물관리를 위한 장소를 가리켰으나 오늘날에는 '문서들 전체'와 문서들 내부에 형성된 '유기적 관계들의 전체'를 나타내는 의미로 발전하였다. 특히 후자의 의미와 관련하여 기록물은 기록된 모든 것을 연구대상으로 간주하는 역사학의 사료와 구분되며 구체적인 의도(주제)에 따라 인위적으로 생산된 도서들이 제공하는 정보와는 달리 자연스러운 업무의 과정에서 생산된다. 뿐만 아니라 기록물은 현용, 준현용의 단계가 마감되고 영구보존 및 활용을 위해 선별되어 영구기록물관리기관에 이관된, 즉 생산목적에 근거하는 역사, 문화적 가치가 지배적인 문서들을 의미한다. 하지만 오늘날 기록물관리는 역사기록물(archives)이외에도 현용, 준현용 단계의 문서들도 관리대상에 포함한다. 이러한 변화는 제 2차 세계대전을 계기로 업무행정의 효율성과 투명성을 위한 북미 Records management의 전통에 근거한다. 우리나라의 기록물관리는 지난 원년부터 북미 기록물관리 전통의 지배적인 영향을 받았다. 그러기에 기록물관리는 정보학의 과도한 영향 하에서 정리보다는 분류의 대상으로, 이관보다는 수집의 대상으로 그리고 문서들 전체로서의 기록물보다는 기록된 모든 것(기록) 또는 문서들이 제공하는 정보들의 관리로 인식되었다. 하지만 이러한 인식으로는 기록물관리가 모든 매체에 기록된 모든 유형의 정보를 관리하는 기술(技術)일 뿐, 학문으로서의 위엄(dignity)과 관리의 효율성을 전혀 보장하지 못한다.

GC×GC/TOF-MS를 이용한 서울 대기 중 유기 에어로졸의 분류 및 동정 (Classification and identification of organic aerosols in the atmosphere over Seoul using two dimensional gas chromatography-time of flight mass spectrometry (GC×GC/TOF-MS) data)

  • 전소현;임형배;최나래;이지이;안윤경;김용표
    • 한국입자에어로졸학회지
    • /
    • 제14권4호
    • /
    • pp.153-169
    • /
    • 2018
  • 기존 대기 에어로졸에서의 유기성분 분석은 분석 기기로 파악한 피크 가운데 동정 가능한 성분 개수에 제한이 있었다. 이 문제를 극복하는 방법의 하나로 2DGC를 활용하여 보다 많은 성분을 동정하고, 이들 성분들의 특성 파악을 용이하게 하기 위해 검출된 피크들을 휘발도에 따라 3개, 극성도에 따라 2개로 분리하여 총 6개의 그룹으로 구분하고, 각 그룹의 피크를 정성/정성 분석하여 화학 특성에 따른 클래스로 구분하는 방법론을 제시하였다. 제시한 방법론을 서울에서 2013년 여름과 2014년 겨울에 측정한 대기 에어로졸의 유기 성분을 2DGC로 분석한 결과에 적용하여 특성 파악 연구를 수행하였다. 정성/정량 분석 결과 유기 성분을 8개의 클래스로 구분할 수 있었다. 이 성분들은 계절별 유사성과 차별성을 보여주었다. 한 예로 고극성-휘발성유기화합물(HP-VOC)의 정성분석 결과 여름에는 furanone 성분이 대부분이었으나, 겨울에는 furanone 성분이 검출되지 않았다. 저극성 반휘발성유기화합물(LP-SVOC)의 정성적 특징은 VOC와 OVOC가 대부분을 차지하고 있는 것이었으며 OVOC가 VOC보다 더 많은 종류로 검출되었다. 그러나 상대적 정량분석에서는 반대로 OVOC보다 VOC가 두 배 더 많은 양을 차지하고 있었다. 즉 LP-SVOC에서 OVOC는 더 다양한 종류가 발견되나 정량적으로 봤을 때는 VOC가 대부분을 차지하고 있다고 할 수 있다. 이러한 분석 결과는 보다 다양한 성분의 유기성분 분석과 함께 정성/정량 분석의 통합적 활용이 필요함을 보여주고 있다. 이 연구에서 2DGC 시스템 결과를 6개의 그룹으로 구분하여 미지 성분 피크를 그 그룹의 특성을 가진 것으로 정성/정량 분석하여 어느 정도 결과를 도출하였다. 그러나 각 그룹의 경계에 있는 성분들이 비슷한 특성을 갖는 경우가 나타났고, 정량 분석에는 아직도 미흡한 부분이 있는 제한점을 보였다. 이 부분에 대한 보다 심도 깊은 연구가 필요하다. 또한 2DGC 시스템은 단일 GC 시스템보다 검출 한도가 높은 제한점을 가지고 있으며, 정량이 아직 확실하지 않은 단점이 있다. 이들 문제점을 해결하기 위해서는 분석 시스템 자체에 대한 심도 깊은 연구가 필요하다.

복합 문서의 의미적 분해를 통한 다중 벡터 문서 임베딩 방법론 (Multi-Vector Document Embedding Using Semantic Decomposition of Complex Documents)

  • 박종인;김남규
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.19-41
    • /
    • 2019
  • 텍스트 데이터에 대한 다양한 분석을 위해 최근 비정형 텍스트 데이터를 구조화하는 방안에 대한 연구가 활발하게 이루어지고 있다. doc2Vec으로 대표되는 기존 문서 임베딩 방법은 문서가 포함한 모든 단어를 사용하여 벡터를 만들기 때문에, 문서 벡터가 핵심 단어뿐 아니라 주변 단어의 영향도 함께 받는다는 한계가 있다. 또한 기존 문서 임베딩 방법은 하나의 문서가 하나의 벡터로 표현되기 때문에, 다양한 주제를 복합적으로 갖는 복합 문서를 정확하게 사상하기 어렵다는 한계를 갖는다. 본 논문에서는 기존의 문서 임베딩이 갖는 이러한 두 가지 한계를 극복하기 위해 다중 벡터 문서 임베딩 방법론을 새롭게 제안한다. 구체적으로 제안 방법론은 전체 단어가 아닌 핵심 단어만 이용하여 문서를 벡터화하고, 문서가 포함하는 다양한 주제를 분해하여 하나의 문서를 여러 벡터의 집합으로 표현한다. KISS에서 수집한 총 3,147개의 논문에 대한 실험을 통해 복합 문서를 단일 벡터로 표현하는 경우의 벡터 왜곡 현상을 확인하였으며, 복합 문서를 의미적으로 분해하여 다중 벡터로 나타내는 제안 방법론에 의해 이러한 왜곡 현상을 보정하고 각 문서를 더욱 정확하게 임베딩할 수 있음을 확인하였다.

BERTopic을 활용한 불면증 소셜 데이터 토픽 모델링 및 불면증 경향 문헌 딥러닝 자동분류 모델 구축 (Topic Modeling Insomnia Social Media Corpus using BERTopic and Building Automatic Deep Learning Classification Model)

  • 고영수;이수빈;차민정;김성덕;이주희;한지영;송민
    • 정보관리학회지
    • /
    • 제39권2호
    • /
    • pp.111-129
    • /
    • 2022
  • 불면증은 최근 5년 새 환자가 20% 이상 증가하고 있는 현대 사회의 만성적인 질병이다. 수면이 부족할 경우 나타나는 개인 및 사회적 문제가 심각하고 불면증의 유발 요인이 복합적으로 작용하고 있어서 진단 및 치료가 중요한 질환이다. 본 연구는 자유롭게 의견을 표출하는 소셜 미디어 'Reddit'의 불면증 커뮤니티인 'insomnia'를 대상으로 5,699개의 데이터를 수집하였고 이를 국제수면장애분류 ICSD-3 기준과 정신의학과 전문의의 자문을 받은 가이드라인을 바탕으로 불면증 경향 문헌과 비경향 문헌으로 태깅하여 불면증 말뭉치를 구축하였다. 구축된 불면증 말뭉치를 학습데이터로 하여 5개의 딥러닝 언어모델(BERT, RoBERTa, ALBERT, ELECTRA, XLNet)을 훈련시켰고 성능 평가 결과 RoBERTa가 정확도, 정밀도, 재현율, F1점수에서 가장 높은 성능을 보였다. 불면증 소셜 데이터를 심층적으로 분석하기 위해 기존에 많이 사용되었던 LDA의 약점을 보완하며 새롭게 등장한 BERTopic 방법을 사용하여 토픽 모델링을 진행하였다. 계층적 클러스터링 분석 결과 8개의 주제군('부정적 감정', '조언 및 도움과 감사', '불면증 관련 질병', '수면제', '운동 및 식습관', '신체적 특징', '활동적 특징', '환경적 특징')을 확인할 수 있었다. 이용자들은 불면증 커뮤니티에서 부정 감정을 표현하고 도움과 조언을 구하는 모습을 보였다. 또한, 불면증과 관련된 질병들을 언급하고 수면제 사용에 대한 담론을 나누며 운동 및 식습관에 관한 관심을 표현하고 있었다. 발견된 불면증 관련 특징으로는 호흡, 임신, 심장 등의 신체적 특징과 좀비, 수면 경련, 그로기상태 등의 활동적 특징, 햇빛, 담요, 온도, 낮잠 등의 환경적 특징이 확인되었다.