• 제목/요약/키워드: Sentence Weight

검색결과 29건 처리시간 0.029초

서울.경기지역 성인여성의 골밀도와 혈압, 칼슘섭취의 상관성 연구 -2011년 국민건강영양조사를 중심으로- (Association of Bone Mineral Density and Blood Pressure, Calcium Intake among Adult Women in Seoul.Kyunggi Area - Based on 2011 KNHANES -)

  • 구재옥
    • 대한지역사회영양학회지
    • /
    • 제18권3호
    • /
    • pp.269-282
    • /
    • 2013
  • This study was carried out to investigate bone mineral density (BMD), blood pressure, calcium, sodium intake and related biochemical variables, and to analyze the relationship between BMD, and blood pressure, physical characteristics, nutrient intakes of Korean adult women. The study subjects were 30~80years old, 513 women living in Seoul and Kyunggi area who participated in 2011 KNHANES. The study subjects were divided into three BMD groups; normal, n = 259 (50.4%), osteopenia, n = 169 (32.9%), and osteoporosis, n = 85 (16.7%). Average height and weight and fat free mass decreased with a decrease in BMD. Average BMD of normal, osteopenia, osteoporosis were 0.87, 0.79, $0.70g/cm^2$, and T-score were 0.42, -0.66, -1.62, respectively. Higher systolic blood pressure, alkaline phosphatase, and triglyceride were significantly associated with a decrease in the BMD. The rates of hypertension were significantly increased from normal to osteoporosis. i.e. 18.5% in normal, 34.3% in osteopenia and 63.5% in osteoporosis. Average nutrientintakes such as protein, fat, calcium, phosphorus, iron, sodium, potassium, vitamin A, vitamin B, vitamin B2, and vitamin C were significantly lower in subjects with lower BMD.n. Average calcium intake of normal, osteopernia and osteoporosis were 528.50, 416.96, 389.56 mg, respectively. There were significant negative correlations between calcium, phosphorus and age, systolic blood pressure, triglyceride. Also, there were negative correlation systolic blood pressure (incomplete sentence). In this study, we found low BMD according to low calcium intake increase the risk of osteoporosis and hypertension rather than sodium intake, also calcium intake decreased with increase age. Therefore, in order to prevent osteoporosis and hypertension, subjects need to be educated regarding the importance of calcium nutrients in diet.

도합유사도를 이용한 한국어 문서요약 시스템 (A Korean Text Summarization System Using Aggregate Similarity)

  • 김재훈;김준홍
    • 인지과학
    • /
    • 제12권1_2호
    • /
    • pp.35-42
    • /
    • 2001
  • 본 논문에서 문서는 문서관계도라고 하는 가중치 그래프로 표현된다. 노드는 문서의 구성요소인 문장을 명사벡터로 표현하고, 링크는 노드들 간의 의미적인 관계를 표현하며 의미적 유사도를 가중치로 가지고 있다. 한 노드의 인접한 노드를 사이의 유사도 합을 도합유사도라고 하며, 이를 문서에서 문장의 중요도로 간주한다. 본 논문에서는도합유사도를 이용한 한국어 문서요약 시스템을 기술한다. 실험에 사용된 평가용 요약문서는 정보처리관련 분야에서 수집된 논문 100편과 KORDIC에서 구축한 신문기사 105건을 이용하였다. 문서요약 시스템에 의해서 생상된 요약문서와 크기가 본문의 20%이고 평가용 요약문서가 논문(서론과 결론)일 경우, 재현율과 정확률은 각각 46.6%와 76.9%를 보였으며, 또한 평가용 요약문서가 신문기사일 경우, 재현율과 정확률은 각각 30.5%과 42.3%를 보였다.

  • PDF

WV-BTM: SNS 단문의 주제 분석을 위한 토픽 모델 정확도 개선 기법 (WV-BTM: A Technique on Improving Accuracy of Topic Model for Short Texts in SNS)

  • 송애린;박영호
    • 디지털콘텐츠학회 논문지
    • /
    • 제19권1호
    • /
    • pp.51-58
    • /
    • 2018
  • SNS의 사용자와 데이터량이 폭발적으로 증가함에 따라, SNS 빅 데이터를 기반으로 한 연구들이 활발히 진행되고 있다. 특히 소셜 마이닝 분야에서는 비 분류된 대용량 SNS 텍스트 데이터로부터 각 텍스트 별 유사성을 파악하고, 그로부터 트렌드를 추출하기 위해 대표적인 토픽 모델 기법인 LDA를 사용한다. 그러나 LDA는 단문 데이터에 대하여 비 빈발 단어 출현으로 인한 의미 희박성(semantic sparsity)으로 인해 양질의 주제 추론이 어렵다는 한계를 가진다. BTM 연구는 이와 같은 LDA의 한계점을 두 단어의 조합을 통해 개선하였으나, BTM 또한 조합된 단어 중 높은 빈도수의 단어에 더 큰 영향을 받아 각 주제와의 연관성을 고려한 가중치 계산이 불가능하다는 한계점을 지닌다. 본 논문은 단어 간의 의미적 연관성을 반영함으로써 기존 연구 BTM의 정확도를 개선하는 방안을 모색한다.

어절 내의 형태소 범주 패턴에 기반한 통계적 자동 띄어쓰기 시스템 (A Stochastic Word-Spacing System Based on Word Category-Pattern)

  • 강미영;정성원;권혁철
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제33권11호
    • /
    • pp.965-978
    • /
    • 2006
  • 본 논문에서는 형태소 unigram과 한국어 어절을 형성하는 형태소 범주 패턴에 기반하여 어절을 인식하는 한국어 띄어쓰기 시스템을 구현하였다. 기존에 많이 연구된 통계 정보를 이용한 띄어쓰기 모델은 비교적 짧은 시간에 쉽게 구현할 수 있는 장점이 있지만, 한국어의 형태 유형론적 특성 때문에 발생하는 (ㄱ) 자료부족 문제와 (ㄴ) 메모리 크기 문제에 효과적으로 대처하지 못한다. 본 논문은 이 두 문제를 동시에 해결하기 위해 어절을 구성하고 있는 개별 형태소의 통계 정보와 그 형태소의 범주의 통계 정보를 기반으로 하여 띄어쓰기 후보 어절들을 추천한다. 임의의 후보 어절이 최종의 띄어쓰기 단위인 어절이 될 수 있는 확률은 (ㄱ) 해당 후보 어절 내의 각 형태소 확률과 (ㄴ) 해당 후보 어절을 구성하기 위해 그 형태소의 범주가 다른 형태소 범주와 함께 형성하는 패턴 내에서 차지하는 '범주가중치'를 고려하여 구한다. 해당 '범주가중치'는 (ㄱ) 말뭉치로부터 실제로 관찰된 어절의 확률과 (ㄴ) 후보 어절 내의 개별 형태소의 확률과 (ㄷ) 그 범주 가중치에 의해 추정된 어절 확률 사이의 평균 에러(error mean)가 최저가 되는 방향으로 학습하여 얻어진다.

Foreign student life experience in Korea after COVID-19

  • Kim, Jungae;Kim, Milang
    • International Journal of Advanced Culture Technology
    • /
    • 제8권4호
    • /
    • pp.279-286
    • /
    • 2020
  • This study was a phenomenological qualitative research that analyzed the experiences of Korean students studying in Korea after the COVID-19 incident. Participants in this study consisted of 22 international students aged 20 to 40 attending the International Exchange Center at C University. The interview period was from September 10, 2020 to October 10, 2020. Giogi qualitative research method was used to analyze vivid experiences of international students. As a result of the analysis, 26 semantic units, 7 subcomponents were derived. The description of the general structure sentence of phenomenology was a description of the meaning of experience from the perspective of participants, and the context and structure descriptions were integrated. The results of this study showed that: The students who came to Korea to study were concerned about Korea in various ways, but they had to adjust to unexpected changes in education methods, anxious about the unexpected COVID-19 disaster. Participants chose to study in Korea based on existing information, so they felt anxiety, regret, fear, and frustration over sudden changes, but taking online classes helped them learn repeatedly and voluntarily became an experience that suited their learning speed. As commuting time has decreased, they were more opportunities to make money in Korea also. Based on the results of this study, the following is suggested: First, the government should establish systematic online infection prevention measures for international students who have poor Korean language skills in preparation for unexpected disasters. Second, non-face-to-face teaching methods should be prepared with the same weight in the face-to-face teaching methods that have been carried out so far in preparation for unexpected disasters.

주제 균형 지능형 텍스트 요약 기법 (Subject-Balanced Intelligent Text Summarization Scheme)

  • 윤여일;고은정;김남규
    • 지능정보연구
    • /
    • 제25권2호
    • /
    • pp.141-166
    • /
    • 2019
  • 최근 다양한 매체를 통해 생성되는 방대한 양의 텍스트 데이터를 효율적으로 관리 및 활용하기 위한 방안으로써 문서 요약에 대한 연구가 활발히 진행되고 있다. 특히 최근에는 기계 학습 및 인공 지능을 활용하여 객관적이고 효율적으로 요약문을 도출하기 위한 다양한 자동 요약 기법이(Automatic Summarization) 고안되고 있다. 하지만 현재까지 제안된 대부분의 텍스트 자동 요약 기법들은 원문에서 나타난 내용의 분포에 따라 요약문의 내용이 구성되는 방식을 따르며, 이와 같은 방식은 비중이 낮은 주제(Subject), 즉 원문 내에서 언급 빈도가 낮은 주제에 대한 내용이 요약문에 포함되기 어렵다는 한계를 갖고 있다. 본 논문에서는 이러한 한계를 극복하기 위해 저빈도 주제의 누락을 최소화하는 문서 자동 요약 기법을 제안한다. 구체적으로 본 연구에서는 (i) 원문에 포함된 다양한 주제를 식별하고 주제별 대표 용어를 선정한 뒤 워드 임베딩을 통해 주제별 용어 사전을 생성하고, (ii) 원문의 각 문장이 다양한 주제에 대응되는 정도를 파악하고, (iii) 문장을 주제별로 분할한 후 각 주제에 해당하는 문장들의 유사도를 계산한 뒤, (iv) 요약문 내 내용의 중복을 최소화하면서도 원문의 다양한 내용을 최대한 포함할 수 있는 자동적인 문서 요약 기법을 제시한다. 제안 방법론의 평가를 위해 TripAdvisor의 리뷰 50,000건으로부터 용어 사전을 구축하고, 리뷰 23,087건에 대한 요약 실험을 수행한 뒤 기존의 단순 빈도 기반의 요약문과 주제별 분포의 비교를 진행하였다. 실험 결과 제안 방법론에 따른 문서 자동 요약을 통해 원문 내각 주제의 균형을 유지하는 요약문을 도출할 수 있음을 확인하였다.

사용자 기기에서 이용한 웹 데이터 분석을 통한 사용자 취향 분석 방법 (An Analysis Method of User Preference by using Web Usage Data in User Device)

  • 이승화;최형기;이은석
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제15권3호
    • /
    • pp.189-199
    • /
    • 2009
  • 최근 인터넷 상에 정보가 방대해지면서 사용자의 요구에 맞는 정보 필터링과 개인화 서비스가 매우 중요해지고 있다. 특히 전자상거래 분야에서 상거래를 활성화시키고 정보 제공자에 대한 만족도와 충성도를 높이기 위해, 사용자의 취향을 기반으로 한 정보 추천은 필수적인 요소가 되었다. 기존 추천 시스템은 사용자의 관심 정보를 기술한 사용자 프로파일을 대부분 정보 제공자 측에서 각각 개별적으로 수집하고 이를 기초로 추천 서비스를 제공한다. 따라서 사용자의 정보는 각 정보 제공자 측에 분산되어 존재하며, 사용자 정보가 부족한 서버에서는 초기에 추천 전략을 세우기 어렵다는 문제가 있다. 또한 사용자정보를 가지고 있는 서버의 경우에도 사용자가 해당 서버를 주기적으로 방문하지 않았다면, 사용자의 동적인 취향 변화를 반영하기 어렵다. 따라서 본 논문에서는 사용자의 행동을 통합적이고, 지속적으로 관찰할 수 있는 사용자 기기에서, 사용자가 이용한 웹 문서 분석을 통해 사용자의 관심 분야를 추론하고, 이를 다른 정보 제공자가 이용하는 새로운 구조의 추천 시스템을 제안한다. 또한 제안 시스템은 보다 효율적인 프로파일 생성을 위해, 웹 페이지에서 식별된 정보 블록에서 관심 단어를 추출하고, 앵커 태그를 분석하여 사용자의 이동 경로를 추적하는 특징을 포함하고 있다. 이러한 제안 시스템의 특징을 통해, 사용자 정보가 부족한 상점에서도 초기에 개인화 서비스 제공이 가능해지며, 사용자가 평소에 이용하는 웹 문서로부터 프로파일을 생성함으로써, 사용자의 동적인 취향 변화를 반영할 수 있다. 또한 정보 블록에서 취향 정보를 추출하는 알고리즘을 통해 보다 빠르고 정확한 프로파일 생성이 가능해진다. 본 논문에서는 최근 구매 활동이 있었던 사용자들의 웹 검색 히스토리와 구매 데이터를 이용하여 제안 시스템의 추천 정확도와 프로파일 분석에 소요되는 시간 측면의 이득을 실험하였으며, 그 결과를 통해 시스템의 유효성을 확인하였다.

사용자 리뷰를 이용한 상품 특징 추출 및 평점 분배 (Product Feature Extraction and Rating Distribution Using User Reviews)

  • 손수빈;전종훈
    • 한국전자거래학회지
    • /
    • 제22권1호
    • /
    • pp.65-87
    • /
    • 2017
  • 온라인 쇼핑몰에서 상품에 대한 사용자 리뷰와 평점을 분석하여 상품의 특징을 자동으로 추출하고 평점이 어떤 특징에 의해 부여된 것인지 판단하여 각 특징에 분배하여 점수화함으로써 상품의 특징을 파악할 수 있는 방법을 제안한다. 기존 방식은 상품 구매 여부를 결정하기 위해서 많은 리뷰와 평점을 읽는데 시간을 허비하거나, 상품의 장단점을 파악하기 어려울 뿐더러 상품에 부여된 평점이 어떠한 특징에 의해서 부여되었는지 알 수 없는 구조로 되어있다. 따라서 본 논문에서는 이러한 문제를 해소하기 위하여 사용자 리뷰에서 상품의 특징을 자동으로 추출하고 각 특징별 평점을 전체 평점에서 자동으로 분배 계산하여 보여주는 방법을 제안한다. 제안하는 방법은 상품별 리뷰와 평점을 수집하여 형태소 분석을 수행하고 이를 통해 상품의 특징과 이에 대한 감성어를 추출한다. 또한, 상품의 특징을 파악할 수 있도록 각 특징에 대한 가중치를 특징이 출현한 문장의 극성을 판단하여 부여하는 방법을 기술한다. 실험을 통하여 얻은 결과와 기존 방법을 비교하는 설문조사를 통하여 제안하는 방법의 유용성을 입증하였고, 상품 리뷰 전문가의 분석과 실험의 결과를 비교함으로써 타당성을 입증하였다.

마켓 인사이트를 위한 상품 리뷰의 다차원 분석 방안 (Multi-Dimensional Analysis Method of Product Reviews for Market Insight)

  • 박정현;이서호;임규진;여운영;김종우
    • 지능정보연구
    • /
    • 제26권2호
    • /
    • pp.57-78
    • /
    • 2020
  • 인터넷의 발달로, 소비자들은 이커머스에서 손쉽게 상품 정보를 확인한다. 이때 활용되는 상품 리뷰는 사용자 경험을 토대로 작성되어 구매의사결정의 효율성을 높일 뿐만 아니라 상품 개발에 도움을 주기도 한다. 하지만, 방대한 양의 상품 리뷰에서 관심있는 평가차원의 세부내용을 파악하는 데에는 많은 시간과 노력이 소비된다. 예를 들어, 노트북을 구매하려는 소비자들은 성능, 무게, 디자인과 같은 평가차원에 대해 각 차원별로 비교 상품의 평가를 확인하고자 한다. 따라서 본 논문에서는 상품 리뷰에서 다차원 상품평가 점수를 자동적으로 생성하는 방안을 제안하고자 한다. 본 연구에서 제시하는 방안은 크게 2단계로 구성된다. 사전준비 단계와 개별상품평가 단계로, 대분류 상품군 리뷰를 토대로 사전에 생성된 차원분류모델과 감성분석모델이 개별상품의 리뷰를 분석하게 된다. 차원분류모델은 워드임베딩과 연관분석을 결합함으로써 기존 연구에서 차원과 단어들의 관련성을 찾기 위한 워드임베딩 방식이 문장 내 단어의 위치만을 본다는 한계를 보완한다. 감성분석모델은 정확한 극성 판단을 위해 구(phrase) 단위로 긍부정이 태깅된 학습데이터를 구성하여 CNN 모델을 생성한다. 이를 통해, 개별상품평가 단계에서는 구 단위의 리뷰에 준비된 모델들을 적용하고 평가차원별로 종합함으로써 다차원 평가점수를 얻을 수 있다. 본 논문의 실험에서는 대분류 상품군 리뷰 약 260,000건으로 평가모델을 구성하고, S사와 L사의 노트북 리뷰 각 1,011건과 1,062건을 실험데이터로 활용한다. 차원분류모델은 구로 분해한 개별상품 리뷰를 6개 평가차원으로 분류했고, 기존 워드임베딩 방식보다 연관분석을 결합한 모델의 정확도가 13.7% 증가했음을 볼 수 있었다. 감성분석모델은 문장보다 구 단위로 학습한 모델이 평가차원을 면밀히 분석함으로써 29.4% 더 높은 정확도를 보임을 확인했다. 본 연구를 통해 판매자, 소비자 모두가 상품의 다차원적 비교가 가능하다는 점에서 구매 및 상품 개발에 효율적인 의사결정을 기대할 수 있다.