• 제목/요약/키워드: 바이오 데이터

검색결과 1,361건 처리시간 0.026초

Radiomics를 이용한 1 cm 이상의 갑상선 유두암의 초음파 영상 분석: 림프절 전이 예측을 위한 잠재적인 바이오마커 (Radiomics Analysis of Gray-Scale Ultrasonographic Images of Papillary Thyroid Carcinoma > 1 cm: Potential Biomarker for the Prediction of Lymph Node Metastasis)

  • 정현정;한경화;이은정;윤정현;박영진;이민아;조은;곽진영
    • 대한영상의학회지
    • /
    • 제84권1호
    • /
    • pp.185-196
    • /
    • 2023
  • 목적 갑상선 유두암 환자에서 림프절 전이를 예측할 수 있는 잠재적인 바이오마커를 개발하기 위해 초음파 영상에 대한 radiomics를 조사하는 것이다. 대상과 방법 2013년 8월부터 2014년 5월까지 431명의 환자가 연구에 포함되었고 통계 소프트웨어를 사용하여 훈련 및 검증 세트로 구분되었다. 총 730개의 radiomics 특징이 자동으로 추출되었다. 훈련 데이터 세트에서 가장 예측 가능한 특징을 선택하기 위해 최소 절대 수축 및 선택 연산자가 사용되었다. 결과 Radiomics 점수는 림프절 전이와 관련이 있었다(p < 0.001). 림프절 전이는 젊은 연령(p = 0.007) 및 더 큰 종양 크기(p = 0.007)와 같은 다른 임상 변수와도 관련이 있었다. 수신자 조작 특성 곡선 하 면적 결과 값은 훈련 세트의 경우 0.687 (95% 신뢰 구간: 0.616-0.759), 검증 세트의 경우 0.650 (95% 신뢰 구간: 0.575-0.726)이었다. 결론 본 연구 결과는 초음파 영상 기반의 radiomics가 papillary thyroid carcinoma 환자에서 경부 림프절 전이를 예측하고 바이오마커로 작용할 가능성을 보여주었다.

Emoticon by Emotions: 소비자 감성 기반 이모티콘 추천 시스템 개발 (Emoticon by Emotions: The Development of an Emoticon Recommendation System Based on Consumer Emotions)

  • 김건우;박도형
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.227-252
    • /
    • 2018
  • 인터넷의 발달을 통해 지속적으로 인스턴트 커뮤니케이션이 발달해왔다. 인스턴트 커뮤니케이션에서 가장 대표적인 것이 메신저 애플리케이션이다. 메신저 애플리케이션에서 이모티콘은 송신자의 감정 전달을 보완하기 위해 활용됐다. 메신저 애플리케이션 송신자의 감정 전달에 약한 모습을 보이는데 그 이유는 면대면 커뮤니케이션이 아니기 때문이다. 이모티콘은 과거 화자의 기분 상태를 나타내는 기호로만 사용됐다. 그러나 현재는 이모티콘은 감정 전달 뿐만 아니라 개인의 특성과 개성을 나타내고 싶어 하는 소비자의 심리를 반영하는 형태로 발전해가고 있다. 이모티콘의 사용 환경이 개선되었고, 이모티콘 자체가 발전함으로써 이모티콘 자체에 대한 관심도는 증가하였다. 대표적인 예로 카카오톡, 라인, 애플 등에서 서비스를 진행하고 있으며, 관련 컨텐츠 상품의 매출도 지속적으로 증가할 것으로 전망하고 있다. 이모티콘 자체의 관심도 증가와 관련 사업의 성장세에도 불구하고 현재 적절한 이모티콘 추천 시스템이 부재하다. 국내 점유율 90% 이상의 메신저 애플리케이션인 카카오톡조차 단순히 인기 순이나 최근 순, 혹은 간략한 카테고리 별로 분류한 정도이다. 소비자들은 원하는 이모티콘을 찾기 위해서 스크롤을 계속해서 내려야 하는 불편함이 있으며, 본인이 원하는 감성의 이모티콘을 찾기 어렵다. 소비자들이 편의성 향상과 기업의 이모티콘 관련 사업의 판매 매출 증가를 위해 소비자가 원하는 이모티콘을 추천해줄 수 있는 이모티콘 추천 시스템이 필요하다. 적절한 이모티콘을 추천하기 위해서 소비자가 이모티콘을 보고 느낀 감성에 대해 정량화할 필요성이 있다. 정량화를 통해 소비자가 원하는 이모티콘 셋이 가진 특징과 감성에 대해 분석할 수 있으며, 분석 결과를 토대로 소비자에게 이모티콘을 추천할 수 있다. 이모티콘은 메타데이터화의 방법으로 정량화가 가능하다. 메타데이터화 방법은 빅데이터 시대에 비정형, 반정형 데이터에 대해서 의미를 추출하기 위해 데이터를 구조화 혹은 조직화하는 작업이다. 비정형 데이터인 이모티콘을 메타데이터화를 통해 구조화한다면, 쉽게 소비자가 원하는 감성 형태로 분류할 수 있을 것으로 생각한다. 정확한 감성을 추출하기 위해 감정과 관련된 선행 연구를 통해 7개의 공통 감성 형용사와 한국어에서만 나타나는 은유 혹은 표현적 특징들을 반영하기 위해 하위 세부 표현들까지 고려했다. 이모티콘의 가장 큰 특징인 캐릭터를 기반으로 "표상", "형상", "색상"의 범주에서 세부 하위 감성들을 수집했다. 정확도 높은 추천 시스템을 설계하기 위해 감성 지표만이 아니라 객관적 지표도 고려하였다. 메타데이터화 방법을 통해 이모티콘이 갖고 있는 캐릭터의 특징을 객관적 지표로 14개, 감성 지표로 활용하기 위해 감성 형용사를 36개를 추출하였다. 추출된 감성 형용사는 대비되는 형용사로 구성하여 총 18개로 줄였으며, 18개의 감성 형용사는 카카오톡의 이모티콘을 인기 순으로 임의의 40개 셋을 대상으로 측정하였다. 측정을 위해 이모티콘을 평가할 조사 대상자 온라인으로 모집하였고, 277명의 20~30대의 이모티콘을 구매한 경험이 있는 소비자를 대상으로 설문을 진행하였다. 설문응답자에게 서로 다른 5개의 이모티콘 셋을 평가하도록 하였다. 평가 결과 수집된 18개의 감정 형용사는 요인분석을 통해 감성 지표 요인으로 추출하였다. 추출된 소비자 감성 지표의 요인은 "코믹", "부드러움", "모던함", "투명함"이었다. 이모티콘의 객관적 지표와 감성 지표 요인을 활용하여 소비자 만족과의 관계를 분석하였고, 객관적 지표와 감성 지표 간의 관계도 분석하였다. 이 과정에서 객관적 지표가 소비자 태도에 바로 영향을 주는 것이 아니라 감성 지표 요인을 통해 소비자 태도에 영향을 주는 매개 효과가 있음을 확인하였다. 분석 결과는 소비자의 감성 평가 메커니즘을 밝혀냈고, 소비자의 이모티콘 감성 평가 메커니즘은 객관적 지표가 감성 지표 요인에 영향을 미치며, 감성 지표 요인은 소비자 만족에 영향을 미치는 관계였다. 따라서 감성 지표 요인의 네 가지만으로 이모티콘 추천 시스템을 설계하였고, 추천 방법은 각 감성과의 거리를 유클리디안 거리로 측정하여 거리의 차가 0에 가까울수록 비슷한 감성으로 정의하였다. 본 연구에서 제안한 이모티콘 시스템의 검증을 위해 각 감성 지표 요인과 소비자 만족의 평균을 지표 값으로 활용하여 각 이모티콘 셋의 감성 패턴을 그래프로 비교하였고, 추천된 이모티콘들과 선택된 이모티콘이 대체로 비슷한 패턴을 그리는 것을 확인하였다. 정확한 검증을 위해 사전 조사하였던 소비자를 대상으로 이모티콘 추천 시스템이 제시한 결과와 유사하게 평가하였는지 유사 순위를 세 구간으로 나누어 비교하였고, 순위별 예측 정확도는 결과 1순위 81.02%, 2순위 76.64%, 3순위 81.63%였다. 본 연구의 결과는 학문적, 실무적으로 다양한 분야에서 활용 가능한 방법론을 제시하였으며, 기존에 없던 이모티콘 추천 시스템의 설계를 통해 소비자에게는 편의와 이모티콘을 서비스하는 기업에는 매출증대의 효과를 가져올 것으로 예상한다. 그리고 본 연구를 통해 지능형 이모티콘 시스템으로 발전할 수 있는 단초를 제공했다는 점에서 의미가 있다. 본 연구에서 제안한 감성 요인들을 활용하여 감성 라이브러리로 사용함으로써, 새로운 이모티콘 출시 시 감성 평가의 지표로 활용할 수 있다. 축적된 감성 라이브러리와 기업의 판매 데이터, 매출 정보, 소비자 데이터를 결합하여 본 연구에서 제안한 추천 시스템을 복합형 추천 시스템으로 발전시켜 단순 소비자의 편의성이나 매출 증가뿐만 아니라 기업에서 전략적으로 활용 가능한 지적 자산으로 활용할 수 있을 것으로 판단한다.

연관규칙 마이닝에서의 동시성 기준 확장에 대한 연구 (An Investigation on Expanding Co-occurrence Criteria in Association Rule Mining)

  • 김미성;김남규;안재현
    • 지능정보연구
    • /
    • 제18권1호
    • /
    • pp.23-38
    • /
    • 2012
  • 온라인 쇼핑몰은 인터넷을 통해 손쉽게 접근이 가능하기 때문에, 최초 구매의사가 발생한 시점으로부터 이에 대한 실제 구매가 실현되기까지의 기간이 오프라인 쇼핑몰에 비해 비교적 짧게 나타난다. 즉 오프라인 쇼핑몰의 경우 구매희망 물품을 바로 구매하기 보다는 몇 개의 물품들을 모아서 구매하는 행태가 일반적이다. 하지만, 인터넷 쇼핑몰의 경우 단 하나의 물품만을 포함하고 있는 주문이 전체 주문의 절반 이상을 차지한다. 따라서 온라인 쇼핑몰 데이터의 장바구니 분석에 전통적 데이터마이닝 기법을 그대로 적용할 경우, Null Transaction의 수가 지나치게 많음으로 인해 합리적 수준의 지지도(Support)를 만족시키는 규칙을 찾는 것이 매우 어렵게 된다. 이러한 이유로 온라인 데이터를 사용한 많은 연구는 동시성 기준을 여러 방법으로 확장하여 사용하였는데, 이들 동시성 기준은 명확한 근거나 합의 없이 연구자의 상황에 따라 임의로 선택된 측면이 있다. 따라서 본 연구에서는 온라인 마켓 분석에 적용되는 구매의 동시성 기준을 정확도 측면에서 평가함으로써, 구매의 동시성 기준 선정을 위한 근거를 제시하고자 한다. 또한 동시성 기준의 정확도가 고객의 평균 구매간격에 따라 상이하게 나타나는 것을 파악하여, 향후 고객의 특성에 따른 차별화된 추천 시스템 구축을 위한 기본 방향을 제시하고자 한다. 이를 위해 국내 대형 인터넷 쇼핑몰의 최근 2년간 실제 거래 내역을 대상으로 실험을 수행하였으며, 실험 결과 단골 고객의 구매 추천을 위한 분석의 경우 추천 범위와 분석 데이터의 동시성 기준을 맞추어 연관규칙을 도출하는 것이 바람직하며, 비단골 고객의 경우 대부분의 추천 범위에 대해서 분석 데이터의 동시성 기준을 비교적 길게 설정하여 연관규칙을 도출하는 것이 바람직한 것으로 나타났다.

RFM 다차원 분석 기법을 활용한 암시적 사용자 피드백 기반 협업 필터링 개선 연구 (A Study on Improvement of Collaborative Filtering Based on Implicit User Feedback Using RFM Multidimensional Analysis)

  • 이재성;김재영;강병욱
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.139-161
    • /
    • 2019
  • 전자상거래 시장의 이용이 보편화 되며 고객들에게 좋은 품질의 물건을 어디서, 얼마나 합리적으로 구매할 수 있는지가 중요해졌다. 이러한 구매 심리의 변화는 방대한 정보 속에서 오히려 고객들의 구매 의사결정을 어렵게 만드는 경향이 있다. 이때 추천 시스템은 고객의 구매 행동을 분석하여 정보 검색에 드는 비용을 줄이고 만족도를 높이는 효과가 있다. 하지만 대부분 추천 시스템은 책이나 영화 등 동종 상품 분류 내에서만 추천이 이뤄진다. 왜냐하면 추천 시스템은 특정 상품에 매긴 구매 평점 데이터를 기반으로 해당 상품 분류 내 유사한 상품에 대한 구매 만족도를 추정하기 때문이다. 그밖에 추천 시스템에서 사용하는 구매 평점의 신뢰성에 대한 문제도 제시되고 있으며 오프라인에선 평점 확보 자체가 어렵다. 이에 본 연구에서는 일련의 문제를 개선하기 위해 RFM 다차원 분석 기법을 활용하여 기존에 사용하던 고객의 구매 평점을 객관적으로 대체할 수 있는 새로운 지표의 활용 가능성을 제안하는 바이다. 실제 기업의 구매 이력 데이터에 해당 지표를 적용해서 검증해본 결과 높게는 약 55%에 해당하는 정확도를 기록했다. 이는 총 4,386종에 달하는 이종 상품들 중 한번도 이용해 본 적 없는 상품을 추천한 결과이기 때문에 검증 결과는 상대적으로 높은 정확도와 활용가치를 의미한다. 그리고 본 연구는 오프라인의 다양한 상품데이터에서도 적용할 수 있는 범용적인 추천 시스템의 가능성을 시사한다. 향후 추가적인 데이터를 확보한다면 제안하는 추천 시스템의 정확도 향상도 기대할 수 있다.

머신러닝을 활용한 수도권 약수터 수질 예측 모델 개발 (Development of a water quality prediction model for mineral springs in the metropolitan area using machine learning)

  • 임영우;엄지연;곽기영
    • 지능정보연구
    • /
    • 제29권1호
    • /
    • pp.307-325
    • /
    • 2023
  • 코로나19 팬데믹의 장기화로 인해 실내 생활에 지쳐가는 사람들이 우울감, 무기력증 등을 해소하기 위해 근거리의 산과 국립공원을 찾는 빈도가 폭발적으로 증가하였다. 자연으로 나온 수많은 사람들이 오가는 걸음을 멈추고 숨을 돌리며 쉬어가는 장소가 있는데 바로 약수터이다. 산이나 국립공원이 아니더라도 근린공원 또는 산책로에서도 간간이 찾아볼 수 있는 약수터는 수도권에만 약 6백여개가 위치해 있다. 하지만 불규칙적이고 수작업으로 수행되는 수질검사로 인해 사람들은 실시간으로 검사 결과를 알 수 없는 상태에서 약수를 음용하게 된다. 따라서 본 연구에서는 약수터 수질에 영향을 미치는 요인을 탐색하고 다양한 곳에 흩어져 있는 데이터를 수집하여 실시간으로 약수터 수질을 예측할 수 있는 모델을 개발하고자 한다. 데이터 수집의 한계로 인해 서울과 경기로 지역을 한정한 후 데이터 관리가 잘 이루어지고 있는 18개 시의 약 300여개 약수터를 대상으로 2015~2020년의 수질 검사 데이터를 확보하였다. 약수터 수질 적합 여부에 영향을 미칠 것으로 여겨지는 다양한 요인들 중 두 차례의 검토를 거쳐 총 10개의 요인을 최종 선별하였다. 최근 주목받고 있는 자동화 머신러닝 기술인 AutoML 기법을 활용하여 20여가지의 머신러닝 기법들 중 예측 성능 기준 상위 5개의 모델을 도출하였으며 그 중 catboost 모델이 75.26%의 예측 분류 정확도로 가장 높은 성능을 가지고 있음을 확인하였다. 추가로 SHAP 기법을 통해 분석에 사용한 변인들이 예측에 미치는 절대적인 영향력을 살펴본 결과 직전 수질 검사에서 부적합 판정을 받았는지 여부가 가장 중요한 요인이었으며 그 외 평균 기온, 과거 연속 2번 수질 부적합 판정 기록 유무, 수질 검사 당일 기온, 약수터 고도 등이 수질 부적합 여부에 영향을 미치고 있음을 확인하였다.

소셜 뉴스를 위한 시간 종속적인 메타데이터 기반의 컨텍스트 공유 프레임워크 (Context Sharing Framework Based on Time Dependent Metadata for Social News Service)

  • 가명현;오경진;홍명덕;조근식
    • 지능정보연구
    • /
    • 제19권4호
    • /
    • pp.39-53
    • /
    • 2013
  • 인터넷의 발달과 SNS의 등장으로 정보흐름의 방식이 크게 바뀌었다. 이러한 변화에 따라 소셜 미디어가 급부상하고 있으며 소셜 미디어와 비디오 콘텐츠가 융합된 소셜 TV, 소셜 뉴스의 중요성이 강조되고 있다. 이러한 환경 속에서 사용자들은 단순히 콘텐츠를 탐색만 하는 것이 아니라 같은 콘텐츠를 이용하고 있는 친구들이나 지인들과 콘텐츠에 대한 정보나 경험들을 공유하고 더 나아가 새로운 콘텐츠를 만들어내기도 한다. 하지만 기존의 소셜 뉴스에서는 이러한 사용자들의 특성을 반영해 주지 못하고 있다. 특히 이용자들의 참여성만을 고려하고 있어서 서비스간의 차별화가 어렵고 뉴스 콘텐츠에 대한 정보나 경험 공유 시 컨텍스트 공유가 어렵다는 문제가 있다. 이를 해결하기 위해 본 논문에서는 뉴스를 내용별로 분할하고 분할된 뉴스에서 추출된 시간 종속적인 메타데이터를 제공하는 프레임워크를 제안한다. 제안하는 프레임워크에서는 스토리 분할 방법을 이용하여 뉴스 대본을 내용별로 분할한다. 또한 뉴스 전체내용을 대표하는 태그, 분할된 뉴스를 나타내는 서브 태그, 분할된 뉴스가 비디오에서 시작하는 위치 즉, 시간 종속적인 메타데이터를 제공한다. 소셜 뉴스 이용자들에게 시간 종속적인 메타데이터를 제공한다면 이용자들은 전체의 뉴스 내용 중에 자신이 원하는 부분만을 탐색 할 수 있으며 이 부분에 대한 견해를 남길 수 있다. 그리고 뉴스의 전달이나 의견 공유 시 메타데이터를 함께 전달함으로써 전달하고자 하는 내용에 바로 접근이 가능하며 프레임워크의 성능은 추출된 서브 태그가 뉴스의 실제 내용을 얼마나 잘 나타내 주느냐에 따라 결정된다. 그리고 서브 태그는 스토리 분할의 정확성과 서브 태그를 추출하는 방법에 따라 다르게 추출된다. 이 점을 고려하여 의미적 유사도 기반의 스토리 분할 방법을 프레임워크에 적용하였고 벤치마크 알고리즘과 성능 비교 실험을 수행하였으며 분할된 뉴스에서 추출된 서브 태그들과 실제 뉴스의 내용을 비교하여 서브 태그들의 정확도를 분석하였다. 결과적으로 의미적 유사도를 고려한 스토리 분할 방법이 더 우수한 성능을 보였으며 추출된 서브 태그들도 컨텍스트와 관련된 단어들이 추출 되었다.

다양한 강우강도 및 패턴에 따른 WEPP 모형의 유출‧첨두유출‧토양유실량 평가 (Evaluation of Runoff‧Peak Rate Runoff and Sediment Yield under Various Rainfall Intensities and Patterns Using WEPP Watershed Model)

  • 최재완;류지철;김익재;임경재
    • 한국수자원학회논문집
    • /
    • 제45권8호
    • /
    • pp.795-804
    • /
    • 2012
  • 최근 강우강도 및 패턴이 변화함에 따라 전세계적으로 토양유실이 증가하고 있다. 그 결과, 수생태계 건전성이 악화되고, 농업작물이 피해를 입어 수확량이 감소된다. 그동안 유출 및 토양유실을 예측하거나 비점오염원을 감소시키는 연구가 많이 수행되어 왔다. USLE는 수년간 토양유실을 산정하는데 사용되어왔으나, 강우강도나 패턴변화를 적용하기에는 적절하지 못했다. 물리적 기반인 WEPP 모형은 다양한 강우강도 및 패턴변화를 적용하는데 적절하다. 본 연구에서는 WEPP 모형을 이용하여 Huff의 4분위, 다양한 강우간격, 설계강우에 따른 토양유실, 유출, 첨두유출을 산정하였다. 5분간격 강우 데이터와 60분 간격 강우 데이터를 비교한 결과 토양유실은 24%, 유출은19%, 첨두유출은 16%가 차이나는 것으로 나타났다. 유출 및 토양유실이 5분 간격 강우량에서 실측치와 가장 유사한 것으로 나타나 강우데이터의 간격이 짧을수록 더 정확하게 모의할 수 있는 것으로 나타났다. Huff의 4분위를 이용하여 토양유실량, 유출량, 첨두유출량을 산정한 결과 토양유실량, 유출량, 첨두유출량 모두 3분위에서 가장 높게 발생하는 것으로 나타났다. 강원도 홍천지역 빈도별 확률강우를 이용하여 토양유실량, 유출량, 첨두유출량의 변화를 모의하였다. 2년 빈도와 300년 빈도에서 강우량은 167% 증가하였다. 유사량과 유출량, 첨두유출량은 각각 906.2%, 249.4%, 183.9% 증가하여 유사량의 증가율이 가장 큰 것으로 나타났다. 본 연구의 결과에서 보이는 바와 같이 WEPP 모형을 이용하여 향후 기후변화에 따른 유출 및 토양유실의 예측이 가능할 것으로 판단된다.

문서 요약 기법이 가짜 뉴스 탐지 모형에 미치는 영향에 관한 연구 (A Study on the Effect of the Document Summarization Technique on the Fake News Detection Model)

  • 심재승;원하람;안현철
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.201-220
    • /
    • 2019
  • 가짜뉴스가 전세계적 이슈로 부상한 최근 수년간 가짜뉴스 문제 해결을 위한 논의와 연구가 지속되고 있다. 특히 인공지능과 텍스트 분석을 이용한 자동화 가짜 뉴스 탐지에 대한 연구가 주목을 받고 있는데, 대부분 문서 분류 기법을 이용한 연구들이 주를 이루고 있는 가운데 문서 요약 기법은 지금까지 거의 활용되지 않았다. 그러나 최근 가짜뉴스 탐지 연구에 생성 요약 기법을 적용하여 성능 개선을 이끌어낸 사례가 해외에서 보고된 바 있으며, 추출 요약 기법 기반의 뉴스 자동 요약 서비스가 대중화된 현재, 요약된 뉴스 정보가 국내 가짜뉴스 탐지 모형의 성능 제고에 긍정적인 영향을 미치는지 확인해 볼 필요가 있다. 이에 본 연구에서는 국내 가짜뉴스에 요약 기법을 적용했을 때 정보 손실이 일어나는지, 혹은 정보가 그대로 보전되거나 혹은 잡음 제거를 통한 정보 획득 효과가 발생하는지 알아보기 위해 국내 뉴스 데이터에 추출 요약 기법을 적용하여 '본문 기반 가짜뉴스 탐지 모형'과 '요약문 기반 가짜뉴스 탐지 모형'을 구축하고, 다수의 기계학습 알고리즘을 적용하여 두 모형의 성능을 비교하는 실험을 수행하였다. 그 결과 BPN(Back Propagation Neural Network)과 SVM(Support Vector Machine)의 경우 큰 성능 차이가 발생하지 않았지만 DT(Decision Tree)의 경우 본문 기반 모델이, LR(Logistic Regression)의 경우 요약문 기반 모델이 다소 우세한 성능을 보였음을 확인하였다. 결과를 검증하는 과정에서 통계적으로 유의미한 수준으로는 요약문 기반 모델과 본문 기반 모델간의 차이가 확인되지는 않았지만, 요약을 적용하였을 경우 가짜뉴스 판별에 도움이 되는 핵심 정보는 최소한 보전되며 LR의 경우 성능 향상의 가능성이 있음을 확인하였다. 본 연구는 추출요약 기법을 국내 가짜뉴스 탐지 연구에 처음으로 적용해 본 도전적인 연구라는 점에서 의의가 있다. 하지만 한계점으로는 비교적 적은 데이터로 실험이 수행되었다는 점과 한 가지 문서요약기법만 사용되었다는 점을 제시할 수 있다. 향후 대규모의 데이터에서도 같은 맥락의 실험결과가 도출되는지 검증하고, 보다 다양한 문서요약기법을 적용해 봄으로써 요약 기법 간 차이를 규명하는 확장된 연구가 추후 수행되어야 할 것이다.

개인정보의 공개와 보호에 관한 연구 - 영국 사례를 중심으로 - (A Study on the Disclosure and Exemption of the Personal Data)

  • 김정애
    • 기록학연구
    • /
    • 제29호
    • /
    • pp.225-268
    • /
    • 2011
  • 정보화 사회에서 정보는 개인 뿐 아니라 단체, 기업, 구각 등의 조직에 있어서도 중요한 자원으로 인식된다. 국가적인 차원에서 국민들에게 가능한 많은 정보를 공개하고 이용할 수 있도록 하는 동시에 개인정보를 보호하거나 비밀을 유지하는 등의 프라이버시와 관련된 권리 역시 보호하고 있다. 기록학에서는 이러한 문제를 '접근(access)'이라는 개념으로 다루고 있다. 공공기관이 보유한 정보를 최대한 공개하는 것이 정보공개법의 원칙이고, 개인정보 처리과정에서 다루어지는 개인정보를 최대한 보호하는 것이 데이터보호법의 원칙이다. 이처럼 두 법률이 지향하는 바는 정보의 최대 공개와 최대 보호라는 점에 차이가 있다. 그러나 국민의 알 권리를 충족시키기 위해 정보를 최대한 공개하는 동시에, 프라이버시 권리의 보장을 위해 정보를 최대한 보호하기 위해서는 두 법률이 적절한 균형을 이룰 필요가 있다. 영국은 공공기관의 정보공개를 위한 일반법으로 정보공개법(Freedom of Information Act 2000)을, 개인정보보호를 위한 일반법으로 데이터보호법(Data Protection Act 1998)을 제정했다. 데이터 보호법은 1984년에 제정되어 시행되다 1995년 유럽연합(European Union, EU) 개인정보보호지침의 요구에 부합하기 위해 1998년에 개정되어 오늘날까지 개정 법률을 적용하고 있다. 정보공개법은 미국, 유럽의 다른 나라에 비해 비교적 늦게 제정되었는데 토니 블레어 총리 내각이 열린 정부(Open Government)정책을 추구하면서 2000년에 정보공개법이 제정되었고 2005년에 시행되었다. 정보공개법이 시행되면서 기존의 기록물관리법에 규정된 접근 조항을 폐지하고 정보공개법에 통합시켰다. 이 연구는 영국의 사례를 중심으로 개인정보 관련 조항을 검토하고 두 법률이 상호보완적으로 작용하는 부분과 상충하는 부분을 연구하고자 한다. 이를 바탕으로 공공기관의 개인정보를 처리하는 과정에서 두 법률 사이의 적절한 균형을 이루는 방법을 밝히고자 한다.

국내 실정에 적합한 스마트팜 개발 전략 -6차산업의 발전을 위한 ICT 기술적 특성을 중심으로- (Smart farm development strategy suitable for domestic situation -Focusing on ICT technical characteristics for the development of the industry6.0-)

  • 한상호;주형근
    • 디지털융복합연구
    • /
    • 제20권4호
    • /
    • pp.147-157
    • /
    • 2022
  • 본 연구는 국내 사정에 적합한 스마트팜 기술 전략을 ICT 기술의 국내 사정에 적합한 차별화를 중심으로 제안하고자 했다. 해외 농산업 선진국의 경우 각 나라의 지형적 특성, 농산업 특성, 국민 수요 특성 등을 전반적으로 반영한 특정 단계 개발에 주력함을 확인했으나, 국내 스마트팜의 경우 해외 기술을 여과 없이 수용하여 국내사정에 적합한 기술의 선별적 개발이 수행되지 않음을 확인했다. 따라서, 본 연구는 국내 농촌 인구의 급격한 감소, 인구 고령화, 농작물 가격 경쟁력 상실, 휴경지 증가, 경지 이용률 감소 등 문제에 따라, 차후 스마트팜 ICT 기술 개발 방향성을 품질 좋은 농산물을 창출하여 가격 경쟁력을 갖추기 위한 성능의 우수함, 노동인구 고령화에 따른 사용의 용이성, 영세한 경영규모에 적합한 경제성 등에 주목하여 스마트팜을 추진해야 함을 제시했다. 첫째, 경제성 차원에서 영세농가(1차) 경영환경에 필요한 기능들만 선별하여 ICT 기술을 구성하고, 이들과 원활한 의사소통 체계를 ICT 기술에 적용하여 실제 농가에서 필요로 하는 기능을 점차적으로 업데이트함으로써 비용 감소에 일조할 수 있음을 제안했다. 둘째, 성능차원에 있어서는 국내 고령화 인구에 적합한 빅데이터 난이도 조절, 이들에게 적합한 언어사용, 이들의 예측 성향을 반영한 알고리즘 설정 등 ICT의 의사소통 기능 개선에 주목한다면 작동 정확성을 증대할 수 있음을 제안했다. 셋째, 사용용이성 차원이다. 6차산업(1차(농업,임업)+2차(농수산물가공)+3차(서비스,농어촌체험,유통)) 발전을 위한 ICT 기술에 기반한 스마트팜은 특정 명령어에 따라 동작을 수행하는 바, 특정 명령에 빅데이터에 근거한 추론을 통한 추가적 기능들이 자동적으로 수반될 것과, 각 지역적 환경에 맞춤화된 빅데이터 구성에 기반한 장치를 미리 세팅, 표준화하여 사용용이성을 촉진할 수 있음을 최종 제시했다.