• 제목/요약/키워드: 평가지 생성 알고리즘

검색결과 356건 처리시간 0.021초

GOCI-II 기반 괭생이모자반 모니터링 시스템 성능 평가: 황해 및 동중국해 해역 오탐지 제거 결과를 중심으로 (Performance Evaluation of Monitoring System for Sargassum horneri Using GOCI-II: Focusing on the Results of Removing False Detection in the Yellow Sea and East China Sea)

  • 이한빛;김주은;김문선;김동수;민승환;김태호
    • 대한원격탐사학회지
    • /
    • 제39권6_2호
    • /
    • pp.1615-1633
    • /
    • 2023
  • 괭생이모자반은 황해 및 동중국해에서 대규모 번식하는 부유조류 중 하나로 우리나라 연안에 유입되어 환경 파괴 및 양식업 피해 등 다양한 문제점을 야기한다. 효율적인 피해 예방 및 연안 환경 보존을 위하여 최근 인공위성 기반 원격탐사 기술을 활용한 괭생이모자반 탐지 알고리즘 개발이 활발하게 이루어지고 있다. 하지만, 잘못된 탐지 정보는 해상 수거 선박의 이동 거리 증가, 지자체나 유관기관의 대응 혼선 등을 유발하므로 괭생이모자반 공간정보 생산 시 오탐지 최소화는 매우 중요하다. 본 연구는 국립해양조사원 국가해양위성센터의 GOCI-II 기반 괭생이모자반 탐지 알고리즘을 활용하여 자동으로 오탐지 화소를 제거하는 기술을 적용하였다. 주요 오탐지 발생 원인 분석 결과를 바탕으로 선형·산발적 오탐지 및 봄, 여름철에 중국 연안에서 대량으로 발생하는 녹조류를 오탐지로 간주하여 제거하는 과정을 포함하였다. 2022년 2월 24일부터 6월 25일까지 괭생이모자반 발생일을 대상으로 오탐지 자동 제거 기법을 적용하고, 중해상도 위성 영상을 이용하여 육안 판독 결과를 생성하고 정성적, 정량적 평가를 수행하였다. 선형 오탐지는 완전히 제거하였으며, 산발적 및 녹조 오탐지는 분포 파악에 영향을 주는 대부분의 오탐지 결과를 제거하였다. 자동 오탐지 제거 과정 이후에도 육안 판독 결과 대비 괭생이모자반의 분포 면적 확인이 가능하였으며, 이진분류모델을 이용하여 정확도와 정밀도는 각각 평균 97.73%, 95.4%로 산출하였다. 재현율은 매우 낮은 29.03%였는데, 이는 GOCI-II와 중해상도 위성영상의 관측 시간 불일치에 의한 괭생이모자반 이동 영향, 공간해상도 차이, 정사보정에 따른 위치 편차, 그리고 구름 마스킹 영향에 의한 것으로 추정하였다. 본 연구의 괭생이모자반 오탐지 제거 결과는 공간적인 분포 현황을 준실시간으로 파악할 수 있으나 생체량을 정확하게 추정하는 것은 한계가 존재하였다. 따라서, 지속적인 괭생이모자반 모니터링 시스템 고도화 연구를 통해 향후 괭생이모자반 대응계획수립을 위한 자료로 활용하고자 한다.

비트 클러스터링을 이용한 빈발 패턴 탐사의 성능 개선 방안 (Advanced Improvement for Frequent Pattern Mining using Bit-Clustering)

  • 김의찬;김계현;이철용;박은지
    • 한국공간정보시스템학회 논문지
    • /
    • 제9권1호
    • /
    • pp.105-115
    • /
    • 2007
  • 데이터마이닝은 데이터베이스에 저장되어 있는 많은 일반적인 정보들을 가지고 의미있는 정보를 찾아내는 것이다. 많은 데이터 마이닝 기법들 중에 클러스터링과 연관규칙을 다루는 연구가 많이 이뤄지고 있다. 클러스터링 기법에는 공간데이터를 다루거나 속성데이터(비공간 데이터)를 다루는 많은 기법들이 연구되고 있고, 연관규칙 또한 빈발 패턴을 찾아내는 연구가 활발히 진행되고 있다. 기존의 연구 중 apriori 연관규칙 알고리즘을 개선하는 방법으로 비트 클러스터링을 이용하는 방법이 있다. 우리는 apriori 연관규칙 보다 더 나은 성능을 나타내는 FP-Growth에 대해 살펴보고 FP-Growth의 문제점을 찾아 이를 해결하기 위한 방법으로 비트 클러스터링을 이용하여 해결할 수 있는지에 대해 연구하였다. 본 논문에서는 전체 데이터베이스를 비트 클러스터링을 통해 몇 개의 클러스터로 나누어 FP-Growth 방법에 사용할 것을 제안하였다. 이렇게 하면 기존의 FP-Growth 방법보다 더 나은 성능을 가질 수 있으며 이를 증명하기 위한 실험을 수행하였다. 실험은 패턴 마이닝 연구에서 사용하는 chess 데이터를 이용하였으며, 최소지지도를 다르게 적용하면서 FP-Tree를 생성하는 실험을 하였다. 최소지지도가 높은 경우에는 기존의 방법과 비슷한 결과를 얻었지만 그 외 경우에는 기존의 방법보다 본 논문에서 제안하는 방법이 더 우수한 결과를 얻을 수 있었다. 본 논문의 주요 결론으로서 비트 클러스터링을 이용한 방법이 상대적으로 우수한 데이터 마이닝 방법임을 정리하였으며, 아울러 GML 데이터를 위한 비트 클러스터링의 적용방법론에 대하여도 논의하였다.적 성분으로 평가된다. 이러한 잠재적 추적자들에 근거할 때, 한국 서남해에 발달하고 있는 니질 퇴적대의 전퇴적물은 한국과 중국의 혼합 기원으로 해석되나, 실트와 점토 구간의 퇴적물로 나누어 볼 때 그기원이 각각 다르게 나타났다. 즉, 점토 퇴적물은 한국과 중국의 혼합 기원으로, 실트 퇴적물은 한국 기원이 우세한 것으로 해석된다. 과립에 황금입자가 표지되었다. 따라서 1일 동안 배설되는 분비배설항원은 선모충 유충의 표피와 stichocyte의 ${\alpha}_0\;{\alpha}_1$ 과립에서 유도되는 반면에 3일 동안 배설되는 분비배설항원은 표피와 stichocyte의 ${\alpha}_0$ 과립에서 유도되고, 선모충유충 감염후 1주, 4주에 실험쥐에서 형성되는 감염항체는 선모충의 표피와 기저층 그리고 EIM에서 분비되는 항원에 의하여 생성된다. 이상의 결과로 선모충의 분비배설항원과 감염항원은 선모충 유충의 표피와 EIM및 stichocyte의 ${\alpha}_0\;{\alpha}_1$ 과립에서 유도되며 이들은 45 kDa 단백을 포함하고 있는 것으로 생각된다.성하고 있는 세포들에는 세포질이 어두운 세포와 밝은 세포가 있었으며, 세포질내에는 전자밀도가 높은 분비과립이 관찰되었다. 전체적인 특징은 눈물샘분비세포 중 장액세포의 것과 비슷하였으나, 과립의 크기는 작았다. 분비관을 구성하는 세포들 사이에도 연접복합체가 매우 잘 발달되어 있었다. 샘포에서 사이관으로 이행되는 곳에서도 샘포세포와 사이관세포 사이에서도 연접복합체가 관찰되었다. 분비관세포의 분비과립 가운데는 중심부분에 전자밀도가

  • PDF

사회문제 해결형 기술수요 발굴을 위한 키워드 추출 시스템 제안 (A Proposal of a Keyword Extraction System for Detecting Social Issues)

  • 정다미;김재석;김기남;허종욱;온병원;강미정
    • 지능정보연구
    • /
    • 제19권3호
    • /
    • pp.1-23
    • /
    • 2013
  • 융합 R&D가 추구해야 할 바람직한 방향은 이종 기술 간의 결합에 의한 맹목적인 신기술 창출이 아니라, 당면한 주요 문제를 해결함으로써 사회적 니즈를 충족시킬 수 있는 기술을 개발하는 것이다. 이와 같은 사회문제 해결형 기술 R&D를 촉진하기 위해서는 우선 우리 사회에서 주요 쟁점이 되고 있는 문제들을 선별해야 한다. 그런데 우선적이고 중요한 사회문제를 분별하기 위해 전문가 설문조사나 여론조사 등 기존의 사회과학 방법론을 사용하는 것은 참여자의 선입견이 개입될 수 있고 비용이 많이 소요된다는 한계를 지닌다. 기존의 사회과학 방법론이 지닌 문제점을 보완하기 위하여 본 논문에서는 사회적 이슈를 다루고 있는 대용량의 뉴스기사를 수집하고 통계적인 기법을 통하여 사회문제를 나타내는 키워드를 추출하는 시스템의 개발을 제안한다. 2009년부터 최근까지 3년 동안 10개 주요 언론사에서 생산한 약 백 30만 건의 뉴스기사에서 사회문제를 다루는 기사를 식별하고, 한글 형태소 분석, 확률기반의 토픽 모델링을 통해 사회문제 키워드를 추출한다. 또한 키워드만으로는 정확한 사회문제를 파악하기 쉽지 않기 때문에 사회문제와 연관된 키워드와 문장을 찾아서 연결하는 매칭 알고리즘을 제안하다. 마지막으로 사회문제 키워드 비주얼라이제이션 시스템을 통해 시계열에 따른 사회문제 키워드를 일목요연하게 보여줌으로써 사회문제를 쉽게 파악할 수 있도록 하였다. 특히 본 논문에서는 생성확률모델 기반의 새로운 매칭 알고리즘을 제안한다. 대용량 뉴스기사로부터 Latent Dirichlet Allocation(LDA)와 같은 토픽 모델 방법론을 사용하여 자동으로 토픽 클러스터 세트를 추출할 수 있다. 각 토픽 클러스터는 연관성 있는 단어들과 확률값으로 구성된다. 그리고 도메인 전문가는 토픽 클러스터를 분석하여, 각 토픽 클러스터의 레이블을 결정하게 된다. 이를 테면, 토픽 1 = {(실업, 0.4), (해고, 0.3), (회사, 0.3)}에서 토픽 단어들은 실업문제와 관련있으며, 도메인 전문가는 토픽 1을 실업문제로 레이블링 하게 되고, 이러한 토픽 레이블은 사회문제 키워드로 정의한다. 그러나 이와 같이 자동으로 생성된 사회문제 키워드를 분석하여 현재 우리 사회에서 어떤 문제가 발생하고 있고, 시급히 해결해야 될 문제가 무엇인지를 파악하기란 쉽지 않다. 따라서 제안된 매칭 알고리즘을 사용하여 사회문제 키워드를 요약(summarization)하는 방법론을 제시한다. 우선, 각 뉴스기사를 문단(paragraph) 단위로 세그먼트 하여 뉴스기사 대신에 문단 세트(A set of paragraphs)를 가지게 된다. 매칭 알고리즘은 각 토픽 클러스터에 대한 각 문단의 확률값을 측정하게된다. 이때 토픽 클러스터의 단어들과 확률값을 이용하여 토픽과 문단이 얼마나 연관성이 있는지를 계산하게 된다. 이러한 과정을 통해 각 토픽은 가장 연관성이 있는 문단들을 매칭할 수 있게 된다. 이러한 매칭 프로세스를 통해 사회문제 키워드와 연관된 문단들을 검토함으로써 실제 우리 사회에서 해당 사회문제 키워드와 관련해서 구체적으로 어떤 사건과 이슈가 발생하는 지를 쉽게 파악할 수 있게 된다. 또한 매칭 프로세스와 더불어 사회문제 키워드 가시화를 통해 사회문제 수요를 파악하려는 전문가들은 웹 브라우저를 통해 편리하게 특정 시간에 발생한 사회문제가 무엇이며, 구체적인 내용은 무엇인지를 파악할 수 있으며, 시간 순서에 따른 사회이슈의 변동 추이와 그 원인을 알 수 있게 된다. 개발된 시스템을 통해 최근 3년 동안 국내에서 발생했던 다양한 사회문제들을 파악하였고 개발된 알고리즘에 대한 평가를 수행하였다(본 논문에서 제안한 프로토타입 시스템은 http://dslab.snu.ac.kr/demo.html에서 이용 가능함. 단, 구글크롬, IE8.0 이상 웹 브라우저 사용 권장).

챗봇 환경에서 데이터 시각화 인터랙션을 위한 자연어처리 모델 (Natural Language Processing Model for Data Visualization Interaction in Chatbot Environment)

  • 오상헌;허수진;김성희
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제9권11호
    • /
    • pp.281-290
    • /
    • 2020
  • 스마트폰의 보급으로 인해 개인화된 데이터를 활용하고자 하는 서비스들이 증가하고 있다. 특히, 헬스케어와 관련된 서비스들은 다양한 데이터를 다루며, 이를 효과적으로 보여주기 위해 데이터 시각화 기법을 활용하고 있다. 데이터 시각화 기법이 활용되면서 자연스럽게 시각화에서의 인터랙션 또한 함께 강조되고 있다. PC 환경에서 데이터 시각화에 대한 인터랙션은 마우스로 이루어지기 때문에, 데이터에 대한 필터링이 다양하게 제공되고 있다. 반면, 모바일 환경에서의 인터랙션은 화면의 크기가 작고, 인터랙션 가능 여부를 인지하기 어려워 버튼 터치 방식으로 앱에서 제공하는 제한된 시각화만을 제공받을 수 있다. 이러한 모바일 환경에서의 인터랙션 한계를 극복하기 위해, 챗봇과의 대화를 통해 데이터 시각화 인터랙션을 가능하게 하여 사용자들에게 개개인의 데이터를 다양한 시각화를 통해 확인할 수 있도록 하고자 한다. 이를 위해서는 사용자의 질의를 쿼리로 변환하여, 주기적으로 데이터를 축적하고 있는 데이터베이스에서 변환된 쿼리를 통해 결과 데이터를 불러올 수 있어야 한다. 자연어를 쿼리로 변환하는 연구는 현재 많이 이루어지고 있지만, 시각화를 기반으로 하여 사용자의 질의를 쿼리로 변환하는 연구에 대해서는 아직 이루어지지 않았다. 따라서, 본 논문에서는 사전에 데이터 시각화 기법이 정해진 상황에서의 쿼리 생성에 초점을 맞추고자 한다. 지원하는 인터랙션은 태스크 x-축 값에 대한 필터링 및 두 그룹 간 비교이다. 테스트 시나리오는 걸음 수에 대한 데이터를 활용하였으며, x-축 기간에 대한 필터링은 바 그래프, 두 그룹간 비교는 라인 그래프로 나타내었다. 시각화를 통해 요청한 정보를 제공받을 수 있는 자연어처리 모델을 개발하기 위해 1,000명을 대상으로 한 설문조사를 통해 약 15,800개의 학습 데이터를 수집하였다. 알고리즘 개발 및 성능 평가를 진행한 결과, 분류 모델에서는 약 89%, 쿼리 생성 모델에서는 약 99% 정확도를 보였다.

MEGAN을 이용한 국내 BVOCs 배출량 산정: 2012년 6월 사례 연구 (BVOCs Estimates Using MEGAN in South Korea: A Case Study of June in 2012)

  • 김경수;이승재
    • 한국농림기상학회지
    • /
    • 제24권1호
    • /
    • pp.48-61
    • /
    • 2022
  • 한국은 국토의 약 63%가 산림으로 구성되어 있고, 16%가 농경지로 구성되어 있어 도심에서 발생하는 NOx가 산림지역과 농경지에서 발생하는 BVOCs와 결합하여 오존을 생성할 가능성이 높다. 그래서 본 연구에서는 한국의 자연 식생 BVOCs 배출을 추정하기 위해 MODIS의 토지피복 자료와 엽면적지수 자료를 이용하여 입력자료를 생성한 후 MEGAN 모델로 BVOCs의 주요 배출 물질인 이소프렌과 모노테르펜을 대상으로 2012년 6월 한 달 간 모델링을 실시하였다. 그 결과, 해당기간 동안 이소프렌은 10,495 ton, 모노테르펜은 2,709 ton이 배출되었다. 기존 국내에서 BEIS와 CORINAR를 이용하여 연구된 이소프렌의 배출량은 약 24,000 ton, 모노테르펜은 25,000 ton으로 나타났는데, 본 연구와 배출량 차이가 나타난 주된 이유는 모델 알고리즘 차이와 모델 구동 시점에서의 일사량과 기온 등 기상 조건의 차이에 의한 것으로 추정된다. 그리고 모델링 결과와 측정 값의 비교를 위하여, 6월 11일부터 12일까지 이틀 간에 걸쳐, 한국 태화산에서 활엽수의 이소프렌과 침엽수의 모노테르펜 챔버 측정 값을 항공라이다와 방형구 식생자료를 기반으로 산정된 엽생체량 값을 이용하여 산림 단위의 BVOCs 배출량으로 환산하였다. 태화산 지역에서의 MEGAN 모델과 측정 간 BVOCs 배출량을 비교한 결과, 시간적인 배출 경향은 유사했으나 이소프렌은 MEGAN 모델에서 최대 6.4배 정도 배출량이 높게 나타났고, 모노테르펜은 최대 5.6배 정도 배출량이 높게 나타났다. MODIS에서 제공되는 토지피복 자료가 한국의 토지피복 특성을 잘 반영하지 못함에도 불구하고 MEGAN 모델링 결과가 측정 값과 다른 모델에 비해 상대적으로 큰 차이를 보이지 않은 것은 MEGAN 내에 기온, 일사량 등에 의해 식생의 BVOCs 배출량을 변환시키는 파라미터들이 현실을 비교적 적절하게 반영하고 있는 것으로 사료된다. 본 연구는 국내의 BVOCs 배출량을 MEGAN 모델을 활용하여 산정하였고, 산림지에서의 실측 자료와 비교를 통해 배출량을 평가하였다는데 의의가 있으며, 산림과 대기 간의 BVOCs 상호작용 연구에 작은 도움이 될 것으로 기대된다. 국내 BVOCs 배출량을 더 정확하게 추정하기 위해서는 지형과 식생의 특성을 더욱 최신으로 반영한 토지피복 및 엽면적지수 자료의 이용, 그리고 수목 및 농작물 등과 같이 개별 식생에 따른 배출계수 등의 대한 연구가 향후에 심도 있게 이루어져야 할 것이다.

ART2 기반 RBF 네트워크와 얼굴 인증을 이용한 주민등록증 인식 (Recognition of Resident Registration Card using ART2-based RBF Network and face Verification)

  • 김광백;김영주
    • 지능정보연구
    • /
    • 제12권1호
    • /
    • pp.1-15
    • /
    • 2006
  • 우리나라의 주민등록증은 주소지, 주민등록번호, 얼굴사진, 지문 등 개인의 다양한 정보를 가진다. 현재의 플라스틱형 주민등록증은 위조 및 변조가 쉽고 그 수법이 날로 전문화 되어가고 있다. 따라서 육안으로 위조 및 변조 사실을 쉽게 확인하기가 어려워 사회적으로 문제를 일으키고 있다. 이에 본 논문에서는 개선된 ART2 기반 RBF 네트워크에 이용한 주민등록번호 인식과 얼굴 인증을 통한 주민등록증 자동 인식 방법을 제안한다. 제안된 방법은 주민등록증 영상으로부터 주민등록번호와 발행일을 추출하기 위하여 주민등록증 영상에 소벨 마스킹와 미디언 필터링을 적용한 후에 수평 스미어링을 적용하여 주민등록번호와 발행일 영역을 추출한다. 그리고 원영상에 대해 고주파 필터링을 적용하여 영상 전체를 이진화하고, 이진화된 영상에 CDM 마스크를 적용하여 주민등록번호와 발행일 코드를 복원한 다음, 검출된 각 영역에 대해 4-방향 윤곽선 추적 알고리즘을 적용하여 개별 문자를 추출한다. 추출된 주민등록번호 등의 개별 문자를 인식하기 위해 개선된 ART2 기반 RBF 네트워크를 제안하고 인식에 적용한다. 제안된 ART2 기반 RBF 네트워크는 학습 성능을 개선하기 위하여 중간층과 출력층의 학습에 퍼지 제어 기법을 적용하여 학습률을 동적으로 조정한다. 얼굴 인증은 템플릿 매칭 알고리즘을 이용하여 얼굴 템플릿 데이터베이스를 구축하고 주민등록증에서 추출된 얼굴 영역과의 유사도를 측정하여 주민등록증 얼굴 영역의 위조여부를 판별한다. 제안된 주민등록증 인식 방법의 성능을 평가하기 위해 원본 주민등록증 영상에 대해 얼굴 영역 위조, 노이즈추가, 대비 증감, 밝기 증감 그리고 영상 흐리기 등의 변형된 영상들을 생성하여 실험한 결과, 제안된 방법이 주민등록번호 인식 및 얼굴 인증에 있어서 우수한 성능이 있음을 확인하였다

  • PDF