• 제목/요약/키워드: Labels

검색결과 738건 처리시간 0.026초

다중센서 고해상도 위성영상의 딥러닝 기반 영상매칭을 위한 학습자료 구성에 관한 연구 (A Study on Training Dataset Configuration for Deep Learning Based Image Matching of Multi-sensor VHR Satellite Images)

  • 강원빈;정민영;김용일
    • 대한원격탐사학회지
    • /
    • 제38권6_1호
    • /
    • pp.1505-1514
    • /
    • 2022
  • 영상정합은 다시기 및 다중센서 고해상도 위성영상을 효과적으로 활용하기 위해 필수적으로 선행되는 중요한 과정이다. 널리 각광받고 있는 딥러닝 기법은 위성영상에서 복잡하고 세밀한 특징을 추출하여 영상 간 빠르고 정확한 유사도 판별에 사용될 수 있음에도 불구하고, 학습자료의 양과 질이 결과에 영향을 미치는 딥러닝 모델의 한계와 고해상도 위성영상 기반 학습자료 구축의 어려움에 따라 고해상도 위성영상의 정합에는 제한적으로 적용되어 왔다. 이에 본 연구는 영상정합에서 가장 많은 시간을 소요하는 정합쌍 추출 과정에서 딥러닝 기반 기법의 적용성을 확인하기 위하여, 편향성이 존재하는 고해상도 위성영상 데이터베이스로부터 딥러닝 영상매칭 학습자료를 구축하고 학습자료의 구성이 정합쌍 추출 정확도에 미치는 영향을 분석하였다. 학습자료는 12장의 다시기 및 다중센서 고해상도 위성영상에 대하여 격자 기반의 Scale Invariant Feature Transform(SIFT) 알고리즘을 이용하여 추출한 영상쌍에 참과 거짓의 레이블(label)을 할당한 정합쌍과 오정합쌍의 집합으로 구축되도록 하였다. 구축된 학습자료로부터 정합쌍 추출을 위해 제안된 Siamese convolutional neural network (SCNN) 모델은 동일한 두 개의 합성곱 신경망 구조에 한 쌍을 이루는 두 영상을 하나씩 통과시킴으로써 학습을 진행하고 추출된 특징의 비교를 통해 유사도를 판별한다. 본 연구를 통해 고해상도 위성영상 데이터 베이스로부터 취득된 자료를 딥러닝 학습자료로 활용 가능하며 이종센서 영상을 적절히 조합하여 영상매칭 과정의 효율을 높일 수 있음을 확인하였다. 다중센서 고해상도 위성영상을 활용한 딥러닝 기반 영상매칭 기법은 안정적인 성능을 바탕으로 기존 수작업 기반의 특징 추출 방법을 대체하고, 나아가 통합적인 딥러닝 기반 영상정합 프레임워크로 발전될 것으로 기대한다.

매장 문화재 공간 분포 결정을 위한 지하투과레이더 영상 분석 자동화 기법 탐색 (Automated Analyses of Ground-Penetrating Radar Images to Determine Spatial Distribution of Buried Cultural Heritage)

  • 권문희;김승섭
    • 자원환경지질
    • /
    • 제55권5호
    • /
    • pp.551-561
    • /
    • 2022
  • 지구물리탐사기법은 매장 문화재 조사에 필요한 높은 해상도의 지하 구조 영상 생성과 매장 유구의 정확한 위치 결정하는 데 매우 유용하다. 이 연구에서는 경주 신라왕경 중심방의 고해상도 지하투과레이더 영상에서 유구의 규칙적인 배열이나 선형 구조를 자동적으로 구분하기 위하여 영상처리 기법인 영상 특징 추출과 영상분할 기법을 적용하였다. 영상 특징 추출의 대상은 유구의 원형 적심과 선형의 도로 및 담장으로 캐니 윤곽선 검출(Canny edge detection)과 허프 변환(Hough Transform) 알고리듬을 적용하였다. 캐니 윤곽선 검출 알고리듬으로 검출된 윤곽선 이미지에 허프 변환을 적용하여 유구의 위치를 탐사 영상에서 자동 결정하고자 하였으나, 탐사 지역별로 매개변수를 달리해서 적용해야 한다는 제약이 있었다. 영상 분할 기법의 경우 연결요소 분석 알고리듬과 QGIS에서 제공하는 Orfeo Toolbox (OTB)를 이용한 객체기반 영상분석을 적용하였다. 연결 요소 분석 결과에서, 유구에 의한 신호들이 연결된 요소들로 효과적으로 인식되었지만 하나의 유구가 여러 요소로 분할되어 인식되는 경우도 발생함을 확인하였다. 객체기반 영상분석에서는 평균이동(Large-Scale Mean-Shift, LSMS) 영상 분할을 적용하여 각 분할 영역에 대한 화소 정보가 포함된 벡터 레이어를 우선 생성하였고, 유구를 포함하는 영역과 포함하지 않는 영역을 선별하여 훈련 모델을 생성하였다. 이 훈련모델에 기반한 랜덤포레스트 분류기를 이용해 LSMS 영상분할 벡터 레이어에서 유구를 포함하는 영역과 그렇지 않은 영역이 자동 분류 될 수 있음을 확인하였다. 이러한 자동 분류방법을 매장 문화재 지하투과레이더 영상에 적용한다면 유구 발굴 계획에 활용가능한 일관성 있는 결과를 얻을 것으로 기대한다.

식품의 소비기한 참고치 설정을 위한 안전계수 (Establishment of Safety Factors for Determining Use-by-Date for Foods)

  • 김병후;정수진;강준구;윤요한;신재욱;이철수;하상도
    • 한국식품위생안전성학회지
    • /
    • 제38권6호
    • /
    • pp.528-536
    • /
    • 2023
  • 2021년 11월 5일 '유통기한(流通期限)' 대신 '소비기한(消費期限)'을 표시하도록 하는 「식품 등의 표시·광고에 관한 법률」 시행령과 시행규칙 일부 개정안이 입법 예고되었다. 이에 본 연구는 식품 유형별 소비기한 참고치 설정을 위한 과학적 기반을 구축하고자 과학적 안전계수 산출법을 마련하고, 안전계수를 제시하고자 하였다. 본 연구에서는 온도 남용, pH, 수분활성도, 포장방법에 대해 모의실험을 진행하며 식품 자체의 수명(소비기한)에 영향을 주는 5가지 특성을 1) 수소이온농도(pH), 2) 수분활성도(Aw), 3) 살균 여부, 보존료(항균, 항산화) 함유 여부, 저장성 향상 포장(레토르트, 진공포장, CO2 충진, N2 충진, 탈산소 제 등), 4) 제품 보관 방법 (냉장, 냉동, 상온, 실온), 5) 멸균 여부로 설정하였다. 수소이온농도(pH) 4.6 이상의 식품은 세균 생장이 용이해 가장 높은 안전계수 값인 0.92를 적용하며, pH 3.5 이하의 강산성 식품은 세균 생장이 중단되고 대부분의 효소반응이 감소하므로 안전계수를 적용하지 않았다(1.0). pH 3.5-4.6 사이의 약산성 식품은 미생물(효모, 곰팡이 포함) 생장이 활발하지는 않지만 가능은하므로 중간값인 안전계수 0.96을 적용하였다. 수분활성도(Aw) 0.91 이상의 식품은 미생물(효모, 곰팡이 포함) 생장이 용이해 가장 높은 안전계수 값인 0.92를 적용하며, Aw 8.0 이하의 건조식품은 세균 생장이 중단되고 대부분의 효소반응이 감소하므로 안전계수를 적용하지 않았다(1.0). Aw 0.8-0.9 사이의 반건조 식품은 세균 생장이 활발하지는 않지만 가능은 하며 진균류(효모, 곰팡이) 생장이 용이하므로 중간값인 안전계수 0.96을 적용하였다. 살균, 보존료(항균, 항산화) 함유 또는 저장성 향상 포장(레토르트, 진공, CO2 충진, N2 충진, 탈산소제 등) 식품은 미생물(효모, 곰팡이 포함) 오염도 및 생장, 대부분의 효소반응이 감소하므로 안전계수를 적용하지 않았다(1.0). 위와 같은 처리를 하지 않은 식품은 미생물(효모, 곰팡이 포함) 생장이 용이하고 대부분의 효소반응이 촉진되므로 가장 높은 안전계수 값인 0.92를 적용하였다. 저장 온도(냉동, 냉장, 상온, 실온)별 안전계수는 표준온도 편차 값(냉장 0.07, 냉동 0.08, 상온 0.27, 실온 0.01)을 사용했으며, 온도편차 중 낮은 온도는 안전에 영향을 주지 않으므로 온도 편차의 절반인 높은 온도 값만 안전에 영향을 주므로 50%(0.5)를 곱해주고 온도 초과에 미치는 '유통+소비단계' 기여율(85%)인 0.85를 다시 곱해 나온 안전계수 값인 냉장 0.03, 냉동 0.03, 상온 0.11, 실온 0.01을 적용하였다. 냉장식품의 온도남용에 대한 안전계수는 온도남용 시 실제 노출시간(1시간)을 반영해 50%(0.5) 곱하고, 소비자 냉장식품 온도남용 비율인 92.3%(0.923)를 곱해 도출한 0.407 값을 활용한 안전계수 값인 0.96을 적용하였다. 멸균 제품의 경우 안전계수를 적용하지 않았다. 요인별 특성을 고려하여 안전계수에 기여하는 비중과 이를 활용하여 최종 안전계수값을 산출하는 방법(A그룹-O그룹)을 decision tree로 나타냈다. 본 연구는 과학적으로 산출한 안전계수를 통해 소비기한을 제시함으로써 음식물쓰레기 감량과 탄소 중립성 달성에 기여할 것으로 사료된다.

PL의 브랜드확장이 소비자태도에 미치는 영향에 관한 연구 : 모브랜드 적합도 인식 차이의 조절효과를 중심으로 (The Effect of Brand Extension of Private Label on Consumer Attitude - a focus on the moderating effect of the perceived fit difference between parent brands and an extended brand -)

  • 김종근;김향미;이종호
    • 한국유통학회지:유통연구
    • /
    • 제16권4호
    • /
    • pp.1-27
    • /
    • 2011
  • 브랜드확장은 다양한 마케팅 영역 중에서도 전통적으로 활발하게 연구가 진행되어 왔던 영역으로서, 본 연구는 최근 그 중요성이나 활용도가 급증하고 있는 PL(Private Label)제품에 대해 브랜드확장의 개념을 활용하여 차별적으로 접근하고자 하였다. 최근 PL제품에 관한 마케팅연구가 활발하게 진행되고 있으나, 대부분 기존 틀에서 크게 벗어나지 못한 채 단순한 적용에 그치고 있으며, 특히 브랜드확장에 관련된 연구들에서도 PL시장의 특성을 제대로 반영하고 있다고 볼 수 없다. 특히 PL제품의 확장에 있어서는 두 가지 모브랜드가 존재할 수 있는데, 이에 대한 연구는 부재한 상황이다. 이에 본 연구에서는 확장 PL제품의 태도에 영향을 미치는 변수로서 두 가지 모브랜드인 유통업체와 기존 PL제품에 대한 태도를 제시하였다. 또한 개별 모브랜드가 PL제품의 태도에 미치는 영향은 개별 모브랜드와 확장 PL제품간 유사성에 의해 상이할 것이라고 제안하였으며, 유통업체와 기존 PL제품에 대한 태도에 영향을 미치는 변수로서 신뢰와 만족을 제시하였다. 분석결과 유통업체와 기존 PL제품에 대한 태도 모두 확장 PL제품의 태도에 유의한 영향을 미쳤으며 동시에 적합도 정도에 따라 그 영향력이 상이함도 실제 데이터를 통해 검증하였다. 즉 확장 PL제품의 태도는 모브랜드의 적합도가 보다 강하게 형성된 모브랜드의 영향을 더 크게 받는 것을 확인할 수 있었다. 이를 토대로 향후 PL제품을 확장할 경우 소비자가 보다 긍정적인 태도를 갖고 있는 모브랜드에 기초하여 해당 모브랜드와의 연상이 강하게 나타날 수 마케팅 전략을 구사할 필요가 있을 것이다.

  • PDF

화장품의 세계적인 개발동향과 21세기 아시아인을 위한 기능성 화장품 (Global Cosmetics Trends and Cosmceuticals for 21st Century Asia)

  • T.Joseph Lin
    • 대한화장품학회지
    • /
    • 제23권1호
    • /
    • pp.5-20
    • /
    • 1997
  • 2차대전 이후에 미국, 유럽, 일본의 사례와 냉전 종식 후의 동구권 국가의 사례 등을 볼 때, 전쟁과 가난에 의하여 화장품 소비는 억제되며, 평화와 번영의 시기에는 그 소비가 증대된다. 그 외에도 화장품시장의 성장은 아시아권 국가에서 볼 수 있는 것처럼 경제성장, 대중매체의 발달에 의해서, 혹은, 중국본토에서 볼 수 있는 경제제도의 변화 및 정치 흐름에 의한 것일 수도 있다. 앞에서 본 전쟁, 경제, 정치흐름, 대중매체 등의 요소 이 외에도 생활방식, 종교, 윤리, 가치관 등도 화장품 시장의 성장에 영향을 줄 수 있다. 화장품은 사회의 산물이다. 사회와 그 구성원의 needs가 변하면 그에 따라 화장품도 내용물, 포장, 배송, marketing concepts, 소구사항 등도 변하게 된다. 많은 점에서 화장품은 우리사회의 거울이며, 사회변화를 반영한다. 1970년대 초반까지 미국에서의 화장품은 주로 백인 영성을 위하여 개발되었다. 그러나 60년대의 시민권운동 이후, 70, 80 년대에는 미국의 흑인 여성을 위한 제품(색조화장)시장이 급성장하였으며, 안전성이 제대로 검토되지 않은 원료의 사용으로 부작용이 증가하였다. 이에 따라 FEA 규제에 의하여 70년대부터는 제품에 사용원료를 명기하게 되었다. 기존 원료의 안전성이 다시 검토되었으며 안전성이 확인되지 않은 많은 원료, 특히 기존에 사용되던 많은 색소의 사용이 제한되었다. 결과적으로 안전을 중시하는 "hypoallergenic" 화장품이 유행하였고, 원료의 사용에서도 기능성 있는 복잡한 이름의 원료보다는 소비자에게 쉽게 인식되는 이름의 원료를 선택하게 되었다. 유럽에서도 신원료명기법이 제정되어 신제품 개발을 위한 개발자의 원료선택에영향을 미치게 되었다. 그러나 원료의 명기에 따라 경쟁사의 제품복제가 매우 쉬워졌다. 환경오염도 마찬가지로 화장품 흐름에 영향을 미친다. 예를 들어 성층권의 오존층이 얇아지면서 suncare 제품의 소비가 늘었다. Hair spray제품에 있어서는 propellant로 사용되는 CFC가 오존층 파괴의 주범임이 밝혀지고 나서는 propellant를 다른 것으로 대체한 제품들이 많이 나왔으나 예전에 hair spray가 끌었던 만큼의 인기는 회복할 수 없었다. 이외에도 천연화장품원료의 증가. 비 동물시험법의 개발, 포장의 간소화 등은 시대의 변화를 반영하는 것 들이다. 한편 70년대에 고조에 달했던 아무런 효과도 없는 화장품에 대한 비판에 대해서 80년대에는 효능 위주의 제품이 미국을 휩쓸었으며, FDA에 의하여 이에 제동이 걸렸다. 그러나 고기능성 화장품에 대한 소비자의 요구는 끊이질 않았다. 이때에 유명한 원료로는 AHA가 있으며 이를 사용한 화장품이 의약품이냐 화장품이냐 하는 논쟁이 있었다. 이와 같이 의약품과 화장품의 구분을 명확히 할 필요성이 제기되었으며, 기능성 화장품은 미국에서는 OTC, 일본에서는 quasi-drug 라고 구분하였다. Cosmeceuticals는 cosmetics와 pharmaceuticals의 합성어이며, 90년대 미국에서 관심을 끌었고, 세계적인 관심사가 되었다. 과거에 식품업계에서 nutraceuticals라는 단어가 사용되었으나 FDA에 의하여 의약품으로 분류될 위험성으로 인하여 이 단어를 전면으로 사용하진 않았으며, 무기물과 비타민을 사용한 경우에는 nutra-cosmeceuticals라는 단어를 사용할 수도 있었으나 이 또한 FDA와의 문제가 생길 소지가 있어 사용이 자제되었다. 법적규제에도 불구하고, 소비자의 요구와 새로운 기술에 의하여 계속 개발되고 있으며, 수많은 아시아의 소비자의 욕구를 충족시키기위한 새로운 종류의 cosmeceuticals가 21세기의 문턱에서 범람하고 있다. 아시아권의 화장품시장은 성장을 계속하고 있으며, cosmeticals중에서도 미백 제품이 가장 중요한 종류이다. 백인여성은 갈색의 피부를 갖길 원하는 반면 일본, 중국, 한국의 여성들은 하얀 피부를 갖고자 한다. 단순히 안료를 사용하는 방법이 아닌 피부자체가 하얗게 되길 바라는 것이다. 미국에서는 OTC로 구분된 hydeoquinone이 일본과 한국에서는 사용이 금지되고 있으며, 안전하고 새로운 미백원료의 개발을 위한 탐색이 계속되고 있다. 즉 미국과 유럽의 화장품 회사는 피부를 검게 하기 위하여 melanogenesis를 활성화시키는 방법을 찾고 있으며, 이와 반대로 아시아권의 화장품회사는 melanin합성을 억제하기 위한 방법을 찾고 있다. 각기 다른 소비자의 취향을 만족시키기 위해서 21세기의 화장품 과학자는 상당히 바쁠 것임에 틀림이 없다.임에 틀림이 없다.

  • PDF

CNN-LSTM 조합모델을 이용한 영화리뷰 감성분석 (Sentiment Analysis of Movie Review Using Integrated CNN-LSTM Mode)

  • 박호연;김경재
    • 지능정보연구
    • /
    • 제25권4호
    • /
    • pp.141-154
    • /
    • 2019
  • 인터넷 기술과 소셜 미디어의 빠른 성장으로 인하여, 구조화되지 않은 문서 표현도 다양한 응용 프로그램에 사용할 수 있게 마이닝 기술이 발전되었다. 그 중 감성분석은 제품이나 서비스에 내재된 사용자의 감성을 탐지할 수 있는 분석방법이기 때문에 지난 몇 년 동안 많은 관심을 받아왔다. 감성분석에서는 주로 텍스트 데이터를 이용하여 사람들의 감성을 사전 정의된 긍정 및 부정의 범주를 할당하여 분석하며, 이때 사전 정의된 레이블을 이용하기 때문에 다양한 방향으로 연구가 진행되고 있다. 초기의 감성분석 연구에서는 쇼핑몰 상품의 리뷰 중심으로 진행되었지만, 최근에는 블로그, 뉴스기사, 날씨 예보, 영화 리뷰, SNS, 주식시장의 동향 등 다양한 분야에 적용되고 있다. 많은 선행연구들이 진행되어 왔으나 대부분 전통적인 단일 기계학습기법에 의존한 감성분류를 시도하였기에 분류 정확도 면에서 한계점이 있었다. 본 연구에서는 전통적인 기계학습기법 대신 대용량 데이터의 처리에 우수한 성능을 보이는 딥러닝 기법과 딥러닝 중 CNN과 LSTM의 조합모델을 이용하여 감성분석의 분류 정확도를 개선하고자 한다. 본 연구에서는 대표적인 영화 리뷰 데이터셋인 IMDB의 리뷰 데이터 셋을 이용하여, 감성분석의 극성분석을 긍정 및 부정으로 범주를 분류하고, 딥러닝과 제안하는 조합모델을 활용하여 극성분석의 예측 정확도를 개선하는 것을 목적으로 한다. 이 과정에서 여러 매개 변수가 존재하기 때문에 그 수치와 정밀도의 관계에 대해 고찰하여 최적의 조합을 찾아 정확도 등 감성분석의 성능 개선을 시도한다. 연구 결과, 딥러닝 기반의 분류 모형이 좋은 분류성과를 보였으며, 특히 본 연구에서 제안하는 CNN-LSTM 조합모델의 성과가 가장 우수한 것으로 나타났다.

가정간편식 밥류의 유형별 1회 제공 포장량 당 에너지 및 영양성분 함량 평가 (Energy and nutrition evaluation per single serving package for each type of home meal replacement rice)

  • 최인영;연지영;김미현
    • Journal of Nutrition and Health
    • /
    • 제55권4호
    • /
    • pp.476-491
    • /
    • 2022
  • 본 연구에서는 가정간편식 (HMR)으로 시판되는 밥류의 1회 제공 포장량 실태를 파악하고, 1회 제공 포장량 당 영양표시에 기반으로 한 에너지 및 영양성분 함량 등에 대한 영양평가를 실시하여, 시판 HMR 밥류의 영양표시 정보 활용의 중요성과 가공식품 밥류의 1회 제공 포장량 설정의 기초자료를 제공하고자 하였다. 시장조사는 식품산업통계에서 HMR 밥류의 매출액이 많은 상위브랜드를 포함하여, 인터넷, 편의점, 슈퍼, 대형마트에서 판매되는 제품을 대상으로 2021년 2월부터 7월까지 실시하였다. 총 406개의 제품을 조사하였으며, 유형별로 즉석밥류 (45개), 컵밥류 (64개), 냉동밥류 (188개), 덮밥류 (32개), 김밥류 (38개), 삼각김밥류(39개)의 총 6개 유형으로 분류하였다. 본 연구에서 조사한 총 406개의 HMR 밥류 중 26.1%인 106개 제품에 인분 표시가 있었다. 1회 제공 포장중량은 덮밥류가 297.1 g으로, 컵밥류 (264.0 g), 냉동밥류 (239.5 g), 김밥류 (230.2 g), 즉석밥류 (193.4 g), 삼각김밥류 (121.6 g)에 비하여 유의적으로 높았다 (p < 0.001). 1회 제공 포장중량 당 에너지 또한 덮밥류가 496.0 kcal로, 냉동밥류 (407.1 kcal), 김밥류 (384.2 kcal), 컵밥류 (370.2 kcal), 즉석밥류 (285.7 kcal), 삼각김밥류(218.1 kcal)에 비하여 유의적으로 높았다 (p < 0.001). 1회 제공 포장중량 당 나트륨 함량은 김밥류가 1,021.8 mg으로 가장 높았으며, 덮밥류 (968.2 mg), 컵밥류 (910.2 mg), 냉동밥류 (884.7 mg), 삼각김밥류 (529.9 mg), 즉석밥류 (37.4 mg)의 순으로 나타났다 (p < 0.001). 1회 제공 포장중량 당 가격은 덮밥류가 4,333.8원으로 가장 비쌌으며, 컵밥류 (3,007.8원), 냉동밥류 (2,728.6원), 김밥류 (2,500.0원), 즉석밥류 (2,066.6원), 삼각김밥류 (1,212.8원)의 순으로 나타났다 (p < 0.001). 1회 제공 포장중량 당 1일 영양성분 기준치에 대한 기여율은 모든 유형에서 에너지의 경우 평균 10-25%, 단백질의 경우 10-30%, 나트륨의 경우 2-51%의 범위로 나타났으며, 탄수화물의 경우 평균 15% 내외 (11-22%)의 기여율을 보였다. 밥의 1인 1회 분량인 210 g을 기준으로 HMR 밥류 210 g당 영양소 함량을 평가한 결과, 1일 영양성분 기준치에 대한 비율은 에너지의 경우 삼각김밥류가 18.8%로 가장 높았으며, 냉동밥류 17.9%, 김밥류 17.5%, 덮밥류 17.4%, 즉석밥류 15.3%, 컵밥류 14.9%의 순으로 나타났다 (p < 0.001). 나트륨의 경우 김밥류(46.5%)와 삼각김밥류 (46.1%)가 유의적으로 높았다 (p < 0.001). 당류의 경우 평균 0.6-5.3%, 지방의 경우 3.1-19.4%, 단백질의 경우 11.3-21.4%의 범위로 나타났다. 본 연구는 편의 표집 방법을 이용하였기 때문에 현재 시장에 유통되고 있는 모든 제품을 포함하지 못한 제한점을 가지고 있으나, 매출액에 기반한 대표 제품과 지역적 제한이 없는 온라인 시장을 포함한 조사로 최대한 조사 시점의 시장 제품을 포함하고자 하였다. 이를 통해 HMR 밥류의 에너지와 영양소 함량 및 가격이 유형별 차이를 보이고, 동일 유형내에서도 변동 범위가 넓어 소비자들이 섭취를 위한 선택 시 섭취 목적과 조합하는 식품의 유무와 종류에 따라 영양표시 정보를 확인하고, 정보에 기반한 바람직한 선택이 이루어질 수 있도록 해야 할 것이다. 또한 HMR 밥류의 1 포장량 당 제공량을 동일하게 적용한 평가에서도 HMR 밥류의 유형에 따라 에너지 및 에너지 영양소의 구성에 차이가 있고 나트륨의 함량에 있어서도 큰 차이를 보여, 유형별 밥류의 주된 섭취 용도 (식사/간식)와 형태 (단독/조합) 등에 따른 최종 영양 제공량을 고려한 1인 1회 제공 포장량의 다양성이 필요할 것으로 사료된다.

사회문제 해결형 기술수요 발굴을 위한 키워드 추출 시스템 제안 (A Proposal of a Keyword Extraction System for Detecting Social Issues)

  • 정다미;김재석;김기남;허종욱;온병원;강미정
    • 지능정보연구
    • /
    • 제19권3호
    • /
    • pp.1-23
    • /
    • 2013
  • 융합 R&D가 추구해야 할 바람직한 방향은 이종 기술 간의 결합에 의한 맹목적인 신기술 창출이 아니라, 당면한 주요 문제를 해결함으로써 사회적 니즈를 충족시킬 수 있는 기술을 개발하는 것이다. 이와 같은 사회문제 해결형 기술 R&D를 촉진하기 위해서는 우선 우리 사회에서 주요 쟁점이 되고 있는 문제들을 선별해야 한다. 그런데 우선적이고 중요한 사회문제를 분별하기 위해 전문가 설문조사나 여론조사 등 기존의 사회과학 방법론을 사용하는 것은 참여자의 선입견이 개입될 수 있고 비용이 많이 소요된다는 한계를 지닌다. 기존의 사회과학 방법론이 지닌 문제점을 보완하기 위하여 본 논문에서는 사회적 이슈를 다루고 있는 대용량의 뉴스기사를 수집하고 통계적인 기법을 통하여 사회문제를 나타내는 키워드를 추출하는 시스템의 개발을 제안한다. 2009년부터 최근까지 3년 동안 10개 주요 언론사에서 생산한 약 백 30만 건의 뉴스기사에서 사회문제를 다루는 기사를 식별하고, 한글 형태소 분석, 확률기반의 토픽 모델링을 통해 사회문제 키워드를 추출한다. 또한 키워드만으로는 정확한 사회문제를 파악하기 쉽지 않기 때문에 사회문제와 연관된 키워드와 문장을 찾아서 연결하는 매칭 알고리즘을 제안하다. 마지막으로 사회문제 키워드 비주얼라이제이션 시스템을 통해 시계열에 따른 사회문제 키워드를 일목요연하게 보여줌으로써 사회문제를 쉽게 파악할 수 있도록 하였다. 특히 본 논문에서는 생성확률모델 기반의 새로운 매칭 알고리즘을 제안한다. 대용량 뉴스기사로부터 Latent Dirichlet Allocation(LDA)와 같은 토픽 모델 방법론을 사용하여 자동으로 토픽 클러스터 세트를 추출할 수 있다. 각 토픽 클러스터는 연관성 있는 단어들과 확률값으로 구성된다. 그리고 도메인 전문가는 토픽 클러스터를 분석하여, 각 토픽 클러스터의 레이블을 결정하게 된다. 이를 테면, 토픽 1 = {(실업, 0.4), (해고, 0.3), (회사, 0.3)}에서 토픽 단어들은 실업문제와 관련있으며, 도메인 전문가는 토픽 1을 실업문제로 레이블링 하게 되고, 이러한 토픽 레이블은 사회문제 키워드로 정의한다. 그러나 이와 같이 자동으로 생성된 사회문제 키워드를 분석하여 현재 우리 사회에서 어떤 문제가 발생하고 있고, 시급히 해결해야 될 문제가 무엇인지를 파악하기란 쉽지 않다. 따라서 제안된 매칭 알고리즘을 사용하여 사회문제 키워드를 요약(summarization)하는 방법론을 제시한다. 우선, 각 뉴스기사를 문단(paragraph) 단위로 세그먼트 하여 뉴스기사 대신에 문단 세트(A set of paragraphs)를 가지게 된다. 매칭 알고리즘은 각 토픽 클러스터에 대한 각 문단의 확률값을 측정하게된다. 이때 토픽 클러스터의 단어들과 확률값을 이용하여 토픽과 문단이 얼마나 연관성이 있는지를 계산하게 된다. 이러한 과정을 통해 각 토픽은 가장 연관성이 있는 문단들을 매칭할 수 있게 된다. 이러한 매칭 프로세스를 통해 사회문제 키워드와 연관된 문단들을 검토함으로써 실제 우리 사회에서 해당 사회문제 키워드와 관련해서 구체적으로 어떤 사건과 이슈가 발생하는 지를 쉽게 파악할 수 있게 된다. 또한 매칭 프로세스와 더불어 사회문제 키워드 가시화를 통해 사회문제 수요를 파악하려는 전문가들은 웹 브라우저를 통해 편리하게 특정 시간에 발생한 사회문제가 무엇이며, 구체적인 내용은 무엇인지를 파악할 수 있으며, 시간 순서에 따른 사회이슈의 변동 추이와 그 원인을 알 수 있게 된다. 개발된 시스템을 통해 최근 3년 동안 국내에서 발생했던 다양한 사회문제들을 파악하였고 개발된 알고리즘에 대한 평가를 수행하였다(본 논문에서 제안한 프로토타입 시스템은 http://dslab.snu.ac.kr/demo.html에서 이용 가능함. 단, 구글크롬, IE8.0 이상 웹 브라우저 사용 권장).