• 제목/요약/키워드: automatically

검색결과 6,835건 처리시간 0.037초

위성영상의 방사적 특성을 고려한 구름 탐지 방법 개발 (Development of Cloud Detection Method Considering Radiometric Characteristics of Satellite Imagery)

  • 서원우;강홍기;윤완상;임평채;이수암;김태정
    • 대한원격탐사학회지
    • /
    • 제39권6_1호
    • /
    • pp.1211-1224
    • /
    • 2023
  • 구름은 광학위성을 이용한 국토 관측 및 재난 대응, 변화 탐지 등 지표의 현상을 관측하는데 있어 많은 어려운 문제를 야기한다. 구름의 존재는 영상 처리 단계 뿐만 아니라 최종적으로는 데이터의 품질에 영향을 미치므로 이를 반드시 식별하고 제거하는 과정이 필요하다. 따라서 본 연구에서는 위성영상 내 구름의 분광패턴에 가장 근접한 화소를 탐색 및 추출해 최적의 임계값을 선정하고 임계값을 바탕으로 구름 산출물을 제작하는 일련의 과정을 자동으로 수행하는 새로운 구름 탐지 기법을 개발하고자 하였다. 구름 탐지 기법은 크게 세 단계로 구성된다. 첫 번째 단계에서는 Digital Number (DN) 단위 영상을 대기상층 반사율 단위로 변환하는 과정을 수행한다. 두 번째 단계에서는 대기상층 반사율 영상을 이용하여 Hue-Value-Saturation (HSV) 변환 및 삼각형 임계 처리, 최대우도 분류 등의 전처리를 적용하고 각 영상별로 초기 구름 마스크 생성을 위한 임계값을 결정한다. 세번째 후처리 단계에서는 생성된 초기 구름 마스크에 포함된 노이즈를 제거하고 구름 경계 및 내부를 개선한다. 구름 탐지를 위한 실험 자료로 구름의 공간적, 계절적 분포의 다양성을 보여주는 4~11월 시기에 한반도 지역에서 촬영된 국토위성 L2G 영상을 사용하였다. 제안 방법의 성능을 검증하기 위해 단일 임계화 방법으로 생성된 결과를 비교하였다. 실험 결과, 제안 방법은 기존 방법과 비교하여 전처리 과정을 통해 각 영상의 방사학적 특성을 고려할 수 있어 보다 정확하게 구름을 검출할 수 있었다. 또한, 구름 개체를 제외한 나머지 밝은 물체(판넬식 지붕, 콘크리트 도로, 모래 등)의 영향을 최소화하는 결과를 보여주었다. 제안 방법은 기존 방법 대비 F1-score 기준으로 30% 이상의 개선된 결과를 보여주었으나 눈이 포함된 특정 영상에서 한계점이 있었다.

CT 기반 딥러닝을 이용한 만성 폐쇄성 폐질환의 체성분 정량화와 질병 중증도 (CT-Derived Deep Learning-Based Quantification of Body Composition Associated with Disease Severity in Chronic Obstructive Pulmonary Disease)

  • 송재은;박소현;임명남;이은주;차윤기;윤현정;김우진
    • 대한영상의학회지
    • /
    • 제84권5호
    • /
    • pp.1123-1133
    • /
    • 2023
  • 목적 만성폐쇄성폐질환의 CT에서 자동 정량 측정된 체성분과 폐기능 또는 정량적 변수들 사이의 연관성을 알아보고자 하였다. 대상과 방법 총 290명의 만성폐쇄성폐질환 환자를 대상으로 연구하였다. 흉부 CT에서 근육 및 피하지방 부피, T12 레벨에서 근육 및 피하지방 면적 및 골 감쇠를 딥러닝 기반 분할 알고리즘을 사용하여 획득하였다. Parametric response mapping-derived emphysema (이하 PRMemph), PRM-derived functional small airway disease (이하 PRMfSAD) 및 기도 벽 두께(airway wall thickness; 이하 AWT)-Pi10을 정량적으로 평가하였다. Pearson 상관 분석을 사용하여 체성분과 결과 간의 연관성을 평가하였다. 결과 근육과 피하지방의 부피와 면적은 PRMemph와 PRMfSAD와 음의 상관관계를 보였다(p < 0.05). T12에서의 골밀도는 PRMemph와 음의 상관관계를 보였다(r = -0.1828, p = 0.002). 피하지방의 부피와 면적과 T12에서의 골밀도는 AWT-Pi10과 양의 상관관계를 보였다(r = 0.1287, p = 0.030; r = 0.1668, p = 0.005; r = 0.1279, p = 0.031). 반면에 근육 부피는 AWT-Pi10과 음의 상관관계를 보였다(r = -0.1966, p = 0.001). 근육 부피는 폐기능과 의미 있는 연과성을 보였다(p < 0.001). 결론 흉부 CT에서 정량적으로 평가된 체성분은 만성폐쇄성폐질환의 표현형 또는 중증도와 연관성을 보인다.

가족계획과 모자보건 통합을 위한 조산원의 투입효과 분석 -서산지역의 개입연구 평가보고- (An Intervention Study on Integration of Family Planning and Maternal/Infant Care Services in Rural Korea)

  • 방숙;한성현;이정자;안문영;이인숙;김은실;김종호
    • Journal of Preventive Medicine and Public Health
    • /
    • 제20권1호
    • /
    • pp.165-203
    • /
    • 1987
  • This project was a service-cum-research effort with a quasi-experimental study design to examine the health benefits of an integrated Family Planning (FP)/Maternal & Child health (MCH) Service approach that provides crucial factors missing in the present on-going programs. The specific objectives were: 1) To test the effectiveness of trained nurse/midwives (MW) assigned as change agents in the Health Sub-Center (HSC) to bring about the changes in the eight FP/MCH indicators, namely; (i)FP/MCH contacts between field workers and their clients (ii) the use of effective FP methods, (iii) the inter-birth interval and/or open interval, (iv) prenatal care by medically qualified personnel, (v) medically supervised deliveries, (vi) the rate of induced abortion, (vii) maternal and infant morbidity, and (viii) preinatal & infant mortality. 2) To measure the integrative linkage (contacts) between MW & HSC workers and between HSC and clients. 3) To examine the organizational or administrative factors influencing integrative linkage between health workers. Study design; The above objectives called for quasi-experimental design setting up a study and control area with and without a midwife. An active intervention program (FP/MCH minimum 'package' program) was conducted for a 2 year period from June 1982-July 1984 in Seosan County and 'before and after' surveys were conducted to measure the change. Service input; This study was undertaken by the Soonchunhyang University in collaboration with WHO. After a baseline survery in 1981, trained nurses/midwives were introduced into two health sub-centers in a rural setting (Seosan county) for a 2 year period from 1982 to 1984. A major service input was the establishment of midwifery services in the existing health delivery system with emphasis on nurse/midwife's role as the link between health workers (nurse aids) and village health workers, and the referral of risk patients to the private physician (OBGY specialist). An evaluation survey was made in August 1984 to assess the effectiveness of this alternative integrated approach in the study areas in comparison with the control area which had normal government services. Method of evaluation; a. In this study, the primary objective was first to examine to what extent the FP/MCH package program brought about changes in the pre-determined eight indicators (outcome and impact measures) and the following relationship was first analyzed; b. Nevertheless, this project did not automatically accept the assumption that if two or more activities were integrated, the results would automatically be better than a non-integrated or categorical program. There is a need to assess the 'integration process' itself within the package program. The process of integration was measured in terms of interactive linkages, or the quantity & quality of contacts between workers & clients and among workers. Intergrative linkages were hypothesized to be influenced by organizational factors at the HSC clinic level including HSC goals, sltrurture, authority, leadership style, resources, and personal characteristics of HSC staff. The extent or degree of integration, as measured by the intensity of integrative linkages, was in turn presumed to influence programme performance. Thus as indicated diagrammatically below, organizational factors constituted the independent variables, integration as the intervening variable and programme performance with respect to family planning and health services as the dependent variable: Concerning organizational factors, however, due to the limited number of HSCs (2 in the study area and 3 in the control area), they were studied by participatory observation of an anthropologist who was independent of the project. In this observation, we examined whether the assumed integration process actually occurred or not. If not, what were the constraints in producing an effective integration process. Summary of Findings; A) Program effects and impact 1. Effects on FP use: During this 2 year action period, FP acceptance increased from 58% in 1981 to 78% in 1984 in both the study and control areas. This increase in both areas was mainly due to the new family planning campaign driven by the Government for the same study period. Therefore, there was no increment of FP acceptance rate due to additional input of MW to the on-going FP program. But in the study area, quality aspects of FP were somewhat improved, having a better continuation rate of IUDs & pills and more use of effective Contraceptive methods in comparison with the control area. 2. Effects of use of MCH services: Between the study and control areas, however, there was a significant difference in maternal and child health care. For example, the coverage of prenatal care was increased from 53% for 1981 birth cohort to 75% for 1984 birth cohort in the study area. In the control area, the same increased from 41% (1981) to 65% (1984). It is noteworthy that almost two thirds of the recent birth cohort received prenatal care even in the control area, indicating that there is a growing demand of MCH care as the size of family norm becomes smaller 3. There has been a substantive increase in delivery care by medical professions in the study area, with an annual increase rate of 10% due to midwives input in the study areas. The project had about two times greater effect on postnatal care (68% vs. 33%) at delivery care(45.2% vs. 26.1%). 4. The study area had better reproductive efficiency (wanted pregancies with FP practice & healthy live births survived by one year old) than the control area, especially among women under 30 (14.1% vs. 9.6%). The proportion of women who preferred the 1st trimester for their first prenatal care rose significantly in the study area as compared to the control area (24% vs 13%). B) Effects on Interactive Linkage 1. This project made a contribution in making several useful steps in the direction of service integration, namely; i) The health workers have become familiar with procedures on how to work together with each other (especially with a midwife) in carrying out their work in FP/MCH and, ii) The health workers have gotten a feeling of the usefulness of family health records (statistical integration) in identifying targets in their own work and their usefulness in caring for family health. 2. On the other hand, because of a lack of required organizational factors, complete linkage was not obtained as the project intended. i) In regards to the government health worker's activities in terms of home visiting there was not much difference between the study & control areas though the MW did more home visiting than Government health workers. ii) In assessing the service performance of MW & health workers, the midwives balanced their workload between 40% FP, 40% MCH & 20% other activities (mainly immunization). However, $85{\sim}90%$ of the services provided by the health workers were other than FP/MCH, mainly for immunizations such as the encephalitis campaign. In the control area, a similar pattern was observed. Over 75% of their service was other than FP/MCH. Therefore, the pattern shows the health workers are a long way from becoming multipurpose workers even though the government is pushing in this direction. 3. Villagers were much more likely to visit the health sub-center clinic in the study area than in the control area (58% vs.31%) and for more combined care (45% vs.23%). C) Organization factors (admistrative integrative issues) 1. When MW (new workers with higher qualification) were introduced to HSC, it was noted that there were conflicts between the existing HSC workers (Nurse aids with less qualification than MW) and the MW for the beginning period of the project. The cause of the conflict was studied by an anthropologist and it was pointed out that these functional integration problems stemmed from the structural inadequacies of the health subcenter organization as indicated below; i) There is still no general consensus about the objectives and goals of the project between the project staff and the existing health workers. ii) There is no formal linkage between the responsibility of each member's job in the health sub-center. iii) There is still little chance for midwives to play a catalytic role or to establish communicative networks between workers in order to link various knowledge and skills to provide better FP/MCH services in the health sub-center. 2. Based on the above findings the project recommended to the County Chief (who has power to control the administrative staff and the technical staff in his county) the following ; i) In order to solve the conflicts between the individual roles and functions in performing health care activities, there must be goals agreed upon by both. ii) The health sub·center must function as an autonomous organization to undertake the integration health project. In order to do that, it is necessary to support administrative considerations, and to establish a communication system for supervision and to control of the health sub-centers. iii) The administrative organization, tentatively, must be organized to bind the health worker's midwive's and director's jobs by an organic relationship in order to achieve the integrative system under the leadership of health sub-center director. After submitting this observation report, there has been better understanding from frequent meetings & communication between HW/MW in FP/MCH work as the program developed. Lessons learned from the Seosan Project (on issues of FP/MCH integration in Korea); 1) A majority or about 80% of the couples are now practicing FP. As indicated by the study, there is a growing demand from clients for the health system to provide more MCH services than FP in order to maintain the achieved small size of family through FP practice. It is fortunate to see that the government is now formulating a MCH policy for the year 2,000 and revising MCH laws and regulations to emphasize more MCH care for achieving a small size family through family planning practice. 2) Goal consensus in FP/MCH shouBd be made among the health workers It administrators, especially to emphasize the need of care of 'wanted' child. But there is a long way to go to realize the 'real' integration of FP into MCH in Korea, unless there is a structural integration FP/MCH because a categorical FP is still first priority to reduce the rate of population growth for economic reasons but not yet for health/welfare reasons in practice. 3) There should be more financial allocation: (i) a midwife should be made available to help to promote the MCH program and coordinate services, (in) there should be a health sub·center director who can provide leadership training for managing the integrated program. There is a need for 'organizational support', if the decision of integration is made to obtain benefit from both FP & MCH. In other words, costs should be paid equally to both FP/MCH. The integration slogan itself, without the commitment of paying such costs, is powerless to advocate it. 4) Need of management training for middle level health personnel is more acute as the Government has already constructed 90 MCH centers attached to the County Health Center but without adequate manpower, facilities, and guidelines for integrating the work of both FP and MCH. 5) The local government still considers these MCH centers only as delivery centers to take care only of those visiting maternity cases. The MCH center should be a center for the managment of all pregnancies occurring in the community and the promotion of FP with a systematic and effective linkage of resources available in the county such as i.e. Village Health Worker, Community Health Practitioner, Health Sub-center Physicians & Health workers, Doctors and Midwives in MCH center, OBGY Specialists in clinics & hospitals as practiced by the Seosan project at primary health care level.

  • PDF

한국어 음소 단위 LSTM 언어모델을 이용한 문장 생성 (Korean Sentence Generation Using Phoneme-Level LSTM Language Model)

  • 안성만;정여진;이재준;양지헌
    • 지능정보연구
    • /
    • 제23권2호
    • /
    • pp.71-88
    • /
    • 2017
  • 언어모델은 순차적으로 입력된 자료를 바탕으로 다음에 나올 단어나 문자를 예측하는 모델로 언어처리나 음성인식 분야에 활용된다. 최근 딥러닝 알고리즘이 발전되면서 입력 개체 간의 의존성을 효과적으로 반영할 수 있는 순환신경망 모델과 이를 발전시킨 Long short-term memory(LSTM) 모델이 언어모델에 사용되고 있다. 이러한 모형에 자료를 입력하기 위해서는 문장을 단어 혹은 형태소로 분해하는 과정을 거친 후 단어 레벨 혹은 형태소 레벨의 모형을 사용하는 것이 일반적이다. 하지만 이러한 모형은 텍스트가 포함하는 단어나 형태소의 수가 일반적으로 매우 많기 때문에 사전 크기가 커지게 되고 이에 따라 모형의 복잡도가 증가하는 문제가 있고 사전에 포함된 어휘 외에는 생성이 불가능하다는 등의 단점이 있다. 특히 한국어와 같이 형태소 활용이 다양한 언어의 경우 형태소 분석기를 통한 분해과정에서 오류가 더해질 수 있다. 이를 보완하기 위해 본 논문에서는 문장을 자음과 모음으로 이루어진 음소 단위로 분해한 뒤 입력 데이터로 사용하는 음소 레벨의 LSTM 언어모델을 제안한다. 본 논문에서는 LSTM layer를 3개 또는 4개 포함하는 모형을 사용한다. 모형의 최적화를 위해 Stochastic Gradient 알고리즘과 이를 개선시킨 다양한 알고리즘을 사용하고 그 성능을 비교한다. 구약성경 텍스트를 사용하여 실험을 진행하였고 모든 실험은 Theano를 기반으로 하는 Keras 패키지를 사용하여 수행되었다. 모형의 정량적 비교를 위해 validation loss와 test set에 대한 perplexity를 계산하였다. 그 결과 Stochastic Gradient 알고리즘이 상대적으로 큰 validation loss와 perplexity를 나타냈고 나머지 최적화 알고리즘들은 유사한 값들을 보이며 비슷한 수준의 모형 복잡도를 나타냈다. Layer 4개인 모형이 3개인 모형에 비해 학습시간이 평균적으로 69% 정도 길게 소요되었으나 정량지표는 크게 개선되지 않거나 특정 조건에서는 오히려 악화되는 것으로 나타났다. 하지만 layer 4개를 사용한 모형이 3개를 사용한 모형에 비해 완성도가 높은 문장을 생성했다. 본 논문에서 고려한 어떤 시뮬레이션 조건에서도 한글에서 사용되지 않는 문자조합이 생성되지 않았고 명사와 조사의 조합이나 동사의 활용, 주어 동사의 결합 면에서 상당히 완성도 높은 문장이 발생되었다. 본 연구결과는 현재 대두되고 있는 인공지능 시스템의 기초가 되는 언어처리나 음성인식 분야에서 한국어 처리를 위해 다양하게 활용될 수 있을 것으로 기대된다.

웹기반 지능형 기술가치평가 시스템에 관한 연구 (A Study on Web-based Technology Valuation System)

  • 성태응;전승표;김상국;박현우
    • 지능정보연구
    • /
    • 제23권1호
    • /
    • pp.23-46
    • /
    • 2017
  • 2000년대 이전부터 북미 유럽의 선진국을 중심으로 특정 기업이나 사업(프로젝트)에 관한 가치를 평가하는 사례는 있어 왔으나, 개별 기술(특허)의 경제적 가치를 산정하는 체계나 방법론은 국내를 중심으로 최근 들어 활성화되어 왔다. 이러한 기술가치평가 분야는 기술이전(거래), 현물출자, 사업타당성 분석, 투자유치, 세무/소송 등의 다양한 용도로 활용되고 있다. 물론 기술보증기금의 KTRS, 발명진흥회의 SMART 3.1과 같이, 평가대상기술에 대한 기술력(등급) 평가 혹은 특허등급평가를 정성적으로 수행하는 온라인 시스템은 존재해 왔으나, 대상기술의 정량적인 가치금액까지 산출해 주는 웹기반 지능형 기술가치평가 시스템은 한국과학기술정보연구원(KISTI)에 의해 유일하게 개발 및 공식 오픈되어 확산 활용되고 있다. 본 고에서는 KISTI에서 개발 운영중인 웹기반 'STAR-Value' 시스템을 중심으로, 탑재된 방법론 및 평가모델의 유형, 이를 지원하는 참조정보 및 데이터베이스(D/B)가 어떻게 연계 활용되는지를 소개한다. 특히 미래에 발생할 경제적 수익을 추정하여 현재가치화하는 소득접근법 기반의 대표 모델인 현금흐름할인(DCF) 모델과 특정 로열티율을 기반으로 로열티수입료의 현재가치를 기술료 대가로 산정하는 로열티절감모델을 포함한 6개 모델, 그리고 관련 지원정보(기술수명, 기업(업종)재무정보, 할인율, 산업기술요소 등)의 데이터 기반 연계 방식에 대해 살펴본다. STAR-Value 시스템은 평가대상기술에 대한 국제특허분류(IPC) 혹은 한국표준산업분류(KSIC) 등의 분류 정보로부터 기술순환주기(TCT) 지수, 유사업종(혹은 유사기업)의 매출액 성장률 및 수익성 데이터, 업종별 가중평균자본비용(WACC) 및 산업기술요소 지수 등 메타데이터값을 자동적으로 불러오고 여기에 조정요인을 반영하여 기술가치의 산출결과가 높은 신뢰성 및 객관성을 가지도록 한다. 나아가 대상기술의 잠재적 시장규모와 해당 사업화주체의 시장점유율에 대한 정보까지 보유 재무데이터 기반으로 참조값을 제시하거나 기존에 완료된 평가사례 축적 기반으로 업종별 유사 기술의 가치범위값을 제시해 준다면, 본 시스템이 보다 지능형으로 지원 모듈을 연계 활용하고 실시간으로 손쉽게 고(高)정확도의 기술가치범위를 제시해 줄 수 있을 것으로 기대된다. 본 고에서는 웹기반 STAR-Value 시스템이 참조데이터 기반으로 지능형 연계를 수행하도록 해주는 모형선택 가이드라인 지원기능, 기술가치범위 추론 지원기능, 유사기업 선정 기반의 시장점유율 산정 지원기능의 내부 로직 구성을 설명한다. 상기 지원기능을 통해 비전문가(또는 초보자) 수준에서 최적의 평가모형 선택, 기술가치 범위 추론, 유사기업 선택 및 시장점유율 산정에 대한 정보지원이 데이터 사이언스 및 기계학습 기반으로 수행될 수 있다. 본 연구는 기술가치평가 분야의 이론적 타당성을 평가실무에서 활용할 수 있는 평가모델 및 지원정보를 실제 탑재한 웹기반 시스템의 소개에 의미가 있으며, 추가적으로 보다 객관적이고 손쉬운 지능형 지원시스템의 활용성을 높임으로써, 앞으로 기술사업화의 제 분야에서 다양하게 활용할 수 있을 것으로 기대된다.

텍스트 마이닝 기법을 적용한 뉴스 데이터에서의 사건 네트워크 구축 (Construction of Event Networks from Large News Data Using Text Mining Techniques)

  • 이민철;김혜진
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.183-203
    • /
    • 2018
  • 전통적으로 신문 매체는 국내외에서 발생하는 사건들을 살피는 데에 가장 적합한 매체이다. 최근에는 정보통신 기술의 발달로 온라인 뉴스 매체가 다양하게 등장하면서 주변에서 일어나는 사건들에 대한 보도가 크게 증가하였고, 이것은 독자들에게 많은 양의 정보를 보다 빠르고 편리하게 접할 기회를 제공함과 동시에 감당할 수 없는 많은 양의 정보소비라는 문제점도 제공하고 있다. 본 연구에서는 방대한 양의 뉴스기사로부터 데이터를 추출하여 주요 사건을 감지하고, 사건들 간의 관련성을 판단하여 사건 네트워크를 구축함으로써 독자들에게 현시적이고 요약적인 사건정보를 제공하는 기법을 제안하는 것을 목적으로 한다. 이를 위해 2016년 3월에서 2017년 3월까지의 한국 정치 및 사회 기사를 수집하였고, 전처리과정에서 NPMI와 Word2Vec 기법을 활용하여 고유명사 및 합성명사와 이형동의어 추출의 정확성을 높였다. 그리고 LDA 토픽 모델링을 실시하여 날짜별로 주제 분포를 계산하고 주제 분포의 최고점을 찾아 사건을 탐지하는 데 사용하였다. 또한 사건 네트워크를 구축하기 위해 탐지된 사건들 간의 관련성을 측정을 위하여 두 사건이 같은 뉴스 기사에 동시에 등장할수록 서로 더 연관이 있을 것이라는 가정을 바탕으로 코사인 유사도를 확장하여 관련성 점수를 계산하는데 사용하였다. 최종적으로 각 사건은 각의 정점으로, 그리고 사건 간의 관련성 점수는 정점들을 잇는 간선으로 설정하여 사건 네트워크를 구축하였다. 본 연구에서 제시한 사건 네트워크는 1년간 한국에서 발생했던 정치 및 사회 분야의 주요 사건들이 시간 순으로 정렬되었고, 이와 동시에 특정 사건이 어떤 사건과 관련이 있는지 파악하는데 도움을 주었다. 또한 일련의 사건들의 시발점이 되는 사건이 무엇이었는가도 확인이 가능하였다. 본 연구는 텍스트 전처리 과정에서 다양한 텍스트 마이닝 기법과 새로이 주목받고 있는 Word2vec 기법을 적용하여 봄으로써 기존의 한글 텍스트 분석에서 어려움을 겪고 있었던 고유명사 및 합성명사 추출과 이형동의어의 정확도를 높였다는 것에서 학문적 의의를 찾을 수 있다. 그리고, LDA 토픽 모델링을 활용하기에 방대한 양의 데이터를 쉽게 분석 가능하다는 것과 기존의 사건 탐지에서는 파악하기 어려웠던 사건 간 관련성을 주제 동시출현을 통해 파악할 수 있다는 점에서 기존의 사건 탐지 방법과 차별화된다.

Word2Vec을 활용한 제품군별 시장규모 추정 방법에 관한 연구 (A Study on Market Size Estimation Method by Product Group Using Word2Vec Algorithm)

  • 정예림;김지희;유형선
    • 지능정보연구
    • /
    • 제26권1호
    • /
    • pp.1-21
    • /
    • 2020
  • 인공지능 기술의 급속한 발전과 함께 빅데이터의 상당 부분을 차지하는 비정형 텍스트 데이터로부터 의미있는 정보를 추출하기 위한 다양한 연구들이 활발히 진행되고 있다. 비즈니스 인텔리전스 분야에서도 새로운 시장기회를 발굴하거나 기술사업화 주체의 합리적 의사결정을 돕기 위한 많은 연구들이 이뤄져 왔다. 본 연구에서는 기업의 성공적인 사업 추진을 위해 핵심적인 정보 중의 하나인 시장규모 정보를 도출함에 있어 기존에 제공되던 범위보다 세부적인 수준의 제품군별 시장규모 추정이 가능하고 자동화된 방법론을 제안하고자 한다. 이를 위해 신경망 기반의 시멘틱 단어 임베딩 모델인 Word2Vec 알고리즘을 적용하여 개별 기업의 생산제품에 대한 텍스트 데이터를 벡터 공간으로 임베딩하고, 제품명 간 코사인 거리(유사도)를 계산함으로써 특정한 제품명과 유사한 제품들을 추출한 뒤, 이들의 매출액 정보를 연산하여 자동으로 해당 제품군의 시장규모를 산출하는 알고리즘을 구현하였다. 실험 데이터로서 통계청의 경제총조사 마이크로데이터(약 34만 5천 건)를 이용하여 제품명 텍스트 데이터를 벡터화 하고, 한국표준산업분류 해설서의 산업분류 색인어를 기준으로 활용하여 코사인 거리 기반으로 유사한 제품명을 추출하였다. 이후 개별 기업의 제품 데이터에 연결된 매출액 정보를 기초로 추출된 제품들의 매출액을 합산함으로써 11,654개의 상세한 제품군별 시장규모를 추정하였다. 성능 검증을 위해 실제 집계된 통계청의 품목별 시장규모 수치와 비교한 결과 피어슨 상관계수가 0.513 수준으로 나타났다. 본 연구에서 제시한 모형은 의미 기반 임베딩 모델의 정확성 향상 및 제품군 추출 방식의 개선이 필요하나, 표본조사 또는 다수의 가정을 기반으로 하는 전통적인 시장규모 추정 방법의 한계를 뛰어넘어 텍스트 마이닝 및 기계학습 기법을 최초로 적용하여 시장규모 추정 방식을 지능화하였다는 점, 시장규모 산출범위를 사용 목적에 따라 쉽고 빠르게 조절할 수 있다는 점, 이를 통해 다양한 분야에서 수요가 높은 세부적인 제품군별 시장정보 도출이 가능하여 실무적인 활용성이 높다는 점에서 의의가 있다.

완전성과 간결성을 고려한 텍스트 요약 품질의 자동 평가 기법 (Automatic Quality Evaluation with Completeness and Succinctness for Text Summarization)

  • 고은정;김남규
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.125-148
    • /
    • 2018
  • 다양한 스마트 기기 및 관련 서비스의 증가에 따라 텍스트 데이터가 폭발적으로 증가하고 있으며, 이로 인해 방대한 문서로부터 필요한 정보만을 추려내는 작업은 더욱 어려워졌다. 따라서 텍스트 데이터로부터 핵심 내용을 자동으로 요약하여 제공할 수 있는 텍스트 자동 요약 기술이 최근 더욱 주목을 받고 있다. 텍스트 요약 기술은 뉴스 요약 서비스, 개인정보 약관 요약 서비스 등을 통해 현업에서도 이미 활발하게 적용되고 있으며, 학계에서도 문서의 주요 요소를 선별하여 제공하는 추출(Extraction) 접근법과 문서의 요소를 발췌한 뒤 이를 조합하여 새로운 문장을 구성하는 생성(Abstraction) 접근법에 따라 많은 연구가 이루어지고 있다. 하지만 문서의 자동 요약 기술에 비해, 자동으로 요약된 문서의 품질을 평가하는 기술은 상대적으로 많은 진전을 이루지 못하였다. 요약문의 품질 평가를 다룬 기존의 대부분의 연구들은 사람이 수작업으로 요약문을 작성하여 이를 기준 문서(Reference Document)로 삼고, 자동 요약문과 기준 문서와의 유사도를 측정하는 방식으로 수행되었다. 하지만 이러한 방식은 기준 문서의 작성 과정에 막대한 시간과 비용이 소요될 뿐 아니라 요약자의 주관에 의해 평가 결과가 다르게 나타날 수 있다는 한계를 갖는다. 한편 이러한 한계를 극복하기 위한 연구도 일부 수행되었는데, 대표적으로 전문에 대해 차원 축소를 수행하고 이렇게 축소된 전문과 자동 요약문의 유사도를 측정하는 기법이 최근 고안된 바 있다. 이 방식은 원문에서 출현 빈도가 높은 어휘가 요약문에 많이 나타날수록 해당 요약문의 품질이 우수한 것으로 평가하게 된다. 하지만 요약이란 본질적으로 많은 내용을 줄여서 표현하면서도 내용의 누락을 최소화하는 것을 의미하므로, 단순히 빈도수에 기반한 "좋은 요약"이 항상 본질적 의미에서의 "좋은 요약"을 의미한다고 보는 것은 무리가 있다. 요약문 품질 평가의 이러한 기존 연구의 한계를 극복하기 위해, 본 연구에서는 요약의 본질에 기반한 자동 품질 평가 방안을 제안한다. 구체적으로 요약문의 문장 중 서로 중복되는 내용이 얼마나 적은지를 나타내는 요소로 간결성(Succinctness) 개념을 정의하고, 원문의 내용 중 요약문에 포함되지 않은 내용이 얼마나 적은지를 나타내는 요소로 완전성(Completeness)을 정의한다. 본 연구에서는 간결성과 완전성의 개념을 적용한 요약문 품질 자동 평가 방법론을 제안하고, 이를 TripAdvisor 사이트 호텔 리뷰의 요약 및 평가에 적용한 실험 결과를 소개한다.

골밀도 상태에 따른 검사자의 재현성 평가 (The Precision Test Based on States of Bone Mineral Density)

  • 유재숙;김은혜;김호성;신상기;조시만
    • 핵의학기술
    • /
    • 제13권1호
    • /
    • pp.67-72
    • /
    • 2009
  • ISCD (International Society for Clinical Densitometry)에서는 골밀도 검사자의 전문성을 키우고자 검사자의 재현성 시험을 필수 자격조건으로 요구하고 있다. 하지만, 재현성 시험의 대상자 선정에 대한 권고안이 불확실하여 골밀도 상태에 따른 그룹별 재현성을 시험해 골밀도 차이가 재현성 시험에 영향을 주는지 알아보았다. 2008년 1월부터 6월까지 본원에 내원한 300명(57.8세$\pm$9.02)의 여성 골밀도 수검자를 두 그룹으로 나누어 4명의 검사자가 재현성을 시험하였다. A그룹의 120명은 4명(a,b,c,d)의 검사자가 골밀도 상태와 관계없이 동일한 방법으로 요추부와 대퇴부를 30명씩 두 번 측정하였고 나머지는 B그룹으로 두 명의 검사자가 골밀도 상태에 따라정상, 골다공증, 골감소증 군으로 분류하여 A그룹과 동일한 방법으로 재현성을 시험하였다. 사용된 장비는 GE Lunar Prodigy Advance (Vr11.4)이고, 수집된 자료는 ISCD에서 배포된 Precision Tool을 이용하여 각각의 변동계수율(%CV)를 알아보았으며 SPSS 14.0 통계 프로그램을 사용하여 분석하였다. A그룹의 %CV는 a, b,c, d 검사자가 각각 요추부 1.08, 0.83, 0.72, 1.37%, 대퇴부 1.08, 1.04, 1.4, 0.58 %로 산출되었고 동일 골밀도 상태의 요추와 대퇴부를 비교하면 재현성이 일관되지 않았다. B그룹에서는 a의 요추부 정상군 %CV가 1.26으로 가장 높았고 대퇴부는 0.94로 골다공증 군이 가장 높게 측정됐다. b는 요추부의 정상군 %CV가 0.97로 가장높았고 대퇴부는 1.04로 골다공증 군에서 가장 높았다. 요추부의 정상군과 대퇴부의 골다공증 군은 %CV가 가장 높게 나타나 골밀도 상태에 따른 재현성이 일관되지 않았다. 본원의 골밀도검사 재현성 시험은 골다공증 상태의 수검자를 제외한다. 그 이유는 ISCD의 대상자 선정이 불확실하고, 골밀도가 낮을수록 장비의 골 인식도가 떨어져 재현성 시험을 시행할 경우, 검사자의 수작업을 요하므로 좋은 재현성을 얻기 힘들기 때문이다. 하지만 재현성 결과값은 LSC (Least Significant Change)에 영향을 주기 때문에 장비, 검사자, 수검자에서 발생할 수 있는 모든 오차를 반영해야 한다. 실험결과는 골밀도 상태가 재현성에 영향을 주지 않았으며, 따라서 정상, 골감소, 골다공증의 구별 없이 대상자의 선정 폭을 넓혀 대상에 구애 받지 않고 보다 정확한 의미의 재현성 시험을 해야 할 것으로 판단된다.

  • PDF

전신 뼈 검사에서 Wide Beam Reconstruction 기법의 유용성 (Utility of Wide Beam Reconstruction in Whole Body Bone Scan)

  • 김정열;강청구;박민수;박훈희;임한상;김재삼;이창호
    • 핵의학기술
    • /
    • 제14권1호
    • /
    • pp.83-89
    • /
    • 2010
  • UltraSPECT사의 Wide Beam Reconstruction (WBR)은 노이즈(Noise)와 조준기의 광속 확산 함수 효과(Beam spread function effect)를 제거하고 환자와의 거리를 자동적으로 보상하여 높은 해상도와 대조도를 제공할 수 있어 영상 획득 시간을 짧게 할 수 있고 상당한 영상 질 향상에 도움을 준다고 보고되고 있다. 이에 본 연구에서는 핵의학 분야에서 가장 흔히 이용되는 전신 뼈 스캔에 대해 WBR의 임상적 적용에 대한 유용성을 알아보고자 한다. XpressBone (WBR)의 성능 실험을 위하여 NEMA에서 제공하는 방법에 의하여 선원(Line source)과 SPECT Phantom을 이용하여 공간 분해능을 측정 분석하였다. 실험방법은 선원의 총 계수치를 200 kcps에서 300 kcps로 변화시켜 측정하였으며, SPECT Phantom은 매트릭스 크기를 변화시켜 측정하여 공간분해능에 대한 분석을 하였다. 또한 2009년 1월부터 2009년 9월까지 본원을 내원하여 뼈 스캔을 시행 받은 환자 40명을 두 군으로 나누어 임상 연구를 시행하였다. 1군은 $^{99m}Tc$-HDP 740 MBq (20mCi)를 투여하고 검사속도(20, 30 cm/min)를 변화시켰고, 2군은 동일한 검사속도에서 $^{99m}Tc$-HDP의 투여량을 변화시켜 영상을 획득하여 Standard data와 WBR기법으로 재구성한 영상을 비교 평가하였다. 분석방법은 대퇴골체부에서 뼈와 연부조직간 섭취비(Femur to tissue ratio: FTR)를 측정한 정량적인 분석과 핵의학과 전문의와 5년 이상의 실무경험을 가진 방사선사가 육안적인 분석을 하여 비교 평가하였다. 성능 실험에서 선원을 사용하여 실험한 결과 Planar WBR data는 Standard data에 비하여 분해능이 약 10% 향상되었으며, WBR 반치폭(Full-Width at Half-Maximum)은 16% 향상되었다(Standard data 8.45, WBR data 7.09). SPECT Phantom에서는 약 50%의 분해능이 향상되었으며, WBR 반치폭은 50% 향상되었다(Standard data 3.52, WBR data 1.65). 임상 연구에서는 $^{99m}Tc$-HDP 투여량을 고정시키고 검사속도를 20cm/min과 30 cm/min로 변화시킨 1군에서 Standard data와 WBR data의 전신 뼈 스캔 전면 영상에서 뼈 대비 연부조직간 섭취비는 통계적으로 유의한 차이를 보이지 않았다 (p=0.07). 검사속도를 고정하고 $^{99m}Tc$-HDP 투여량을 변화시킨 2군에서는 Standard data와 WBR data간의 전신 뼈 스캔전면 영상에서는 통계적으로 유의한 차이를 보이지 않았다 (p=0.458). 영상의 육안적 분석에서도 두 군 간 유의한 차이를 보이지 않았다(p>0.05). NEMA test 결과 WBR 기법의 영상에서 분해능이 향상되는 결과를 나타내었고, 임상 실험에서는 기존 재구성 방법에서의 동일한 해상도를 가지면서도 검사시간을 단축시킬 수 있었으며 방사성의약품의 투여량도 줄일 수 있었다. 이미 알려진 바와 같이 WBR은 노이즈를 감소시켜 신호 대 잡음비를 증강시키는 새로운 영상 재구성 방법임을 확인 할 수 있으며 동일한 검사속도에서 투여량을 감소시킬 수 있어 수신자의 피폭선량 경감과 검사시간을 단축할 수 있었으며 임상 현장에서 유용하게 이용되리라 사료된다.

  • PDF