• 제목/요약/키워드: Information processing knowledge

검색결과 1,100건 처리시간 0.023초

구문관계에 기반한 유전자 상호작용 인식 (Detection of Gene Interactions based on Syntactic Relations)

  • 김미영
    • 정보처리학회논문지B
    • /
    • 제14B권5호
    • /
    • pp.383-390
    • /
    • 2007
  • 단백질이나 유전자들 간의 상호작용 인식은 생물학적 현상의 기술에 있어서 필수적이고, 이러한 상호작용의 네트웍 파악은 생물학 접근의 시작이라고 할 수 있다. 최근에, 대량의 생물학 관련 문서로부터 자연언어처리 기술을 사용하여 이러한 정보를 추출하려는 연구들이 많이 등장했다. 또한 이전 연구들은 언어학적 정보가 문서로부터 유전자 상호작용을 자동으로 추출하는 데 있어서 유용하다고 주장하고 있다. 하지만 기존의 방법들은 정확률에 비해 재현율이 많이 낮아서 성능이 그다지 좋지 못했다. 정확률의 감소 없이 재현율의 성능향상을 위해, 이 논문은 생물학관련 문서에서 구문관계에 기반하여 유전자 상호작용을 인식하는 방법을 제안한다. 생물학 도메인에 관련된 전문지식 없이, 우리의 방법은 단지 적은 양의 학습데이터를 사용하여 효과적인 성능을 보인다. LLL05(ICML05 Workshop on Learning Language in Logic)에서 제공한 데이터 포맷을 그대로 사용하여, 상호작용하는 두 유전자 중 작용의 주체가 되는 유전자를 에이전트라 하고 상호 작용의 대상이 되는 유전자를 타겟이라 한다. 본 논문에서 제안하는 첫 단계에서, 에이전트와 타겟 유전자에 대한 유전자-전이 구문관계를 인식한다. 두 번째 단계에서, 유전자 간의 상호작용이 있음을 암시하는 용언리스트를 구축한다. 마지막 단계에서, 상호작용하는 것으로 인식된 두 유전자 중 어느 것이 에이전트이고 타겟인지를 판단하기 위해 구문관계의 방향 정보를 학습한다. LLL05 데이터를 사용한 실험결과에서, 본 논문에서 제안한 방법이 학습 데이터에 대해서는 88%의 F-measure 성능을 보였고, 테스트 데이터에 대해서는 70.4%의 F-measure 성능을 보였다. 이 결과는 기존의 방법들보다 훨씬 더 좋은 성능이다. 우리는 성능에 대한 각 단계의 공헌도를 실험하여, 첫 단계는 재현율 향상에 기여를 하고 두 번째와 세 번째 단계는 정확률 향상에 기여했음을 보인다.

회의 소집을 위한 다중 에이전트 시스템의 구현 (Implementation of A Multiple-agent System for Conference Calling)

  • 유재홍;노승진;성미영
    • 지능정보연구
    • /
    • 제8권2호
    • /
    • pp.205-227
    • /
    • 2002
  • 이 연구는 웹 기반 협동작업 시스템에서 지능적인 에이전트들을 이용하여 원격 회의의 소집을 자동화함으로써 여러 참여자들에게 보다 편리한 형태의 협동작업 환경을 지원해 주는 시스템에 대한 것이다 회의 일정을 잡는 작업을 자동화하는 것은 각 개인의 공적인 일정 뿐만 아니라 개인의 사정과 선호도 등에 대한 세심한 배려를 요구한다. 그러므로, 회의 소집 자동화는 신뢰성과 병렬성을 높이기 위해서 각 개인의 일정을 병렬적으로 별도 관리하는 작업을 지원하는 분산 처리 작업이 요구된다. 이 논문에서는 회의 소집에 들이는 시간과 노력을 최소로 줄여주는 다중 에이전트 시스템의 설계와 구현에 대하여 자세하게 소개한다. 이 시스템은 서버-를라이언트 모델에 기반하며, 서버 측에서는 스케줄 에이전트, 협상 에이전트, 개인정보 관리 에이전트, 그룹 정보 관리 에이전트, 세션관리 에이전트와 조정 에이전트가 활동한다. 클라이언트 측에서는 인터페이스 에이전트, 미디어 에이전트와 협동 에이전트가 활동한다. 이들 에이전트들은 통신은 표준화된 지식 표현 언어를 이용하여 통신하므로 분산 협동 처리를 위한 에이전트들 간의 통신에 있어 가장 큰 문제점인 이형질성을 극복할 수 있도록 해준다. 본 시스템의 회의소집 지원 에이전트들은 전진연결 알고리즘으로 추론하고 역전파 네트워크 알고리즘으로 학습하여 가장 많은 사람이 참여할 수 있는 날짜를 제안해줌으로써 회의 소집자가 회의 소집에 들이는 노력을 최소로 줄일 수 있게 해 준다.

  • PDF

가상대학에서 교수자와 학습자간 상호작용을 위한 지식기반형 문자-얼굴동영상 변환 시스템 (Knowledge based Text to Facial Sequence Image System for Interaction of Lecturer and Learner in Cyber Universities)

  • 김형근;박철하
    • 정보처리학회논문지B
    • /
    • 제15B권3호
    • /
    • pp.179-188
    • /
    • 2008
  • 본 논문에서는 가상대학에서 교수자와 학습자간 상호작용을 위한 지식기반형 문자-얼굴동영상 변환(TTFSI : Text to Facial Sequence Image) 시스템에 관해 연구하였다. TTFSI 시스템의 구현을 위해, 한글의 문법적 특징을 기반으로 가상강의에 사용된 자막정보에 립싱크된 얼굴 동영상 합성하기 위하여 자막정보를 음소코드로 변환하는 방법, 음소코드별 입모양의 변형규칙 작성법, 입모양 변형규칙에 의한 얼굴 동영상 합성법을 제안한다. 제안된 방법에서는 한글의 구조분석을 통해 기본 자모의 발음을 나타내는 10개의 대표 입모양과 조음결합에서 나타나는 78개의 혼합 입모양으로 모든 음절의 입모양을 표현하였다. 특히 PC환경에서의 실시간 영상을 합성하기 위해서 매 프레임마다 입모양을 합성하지 않고, DB에서 88개의 해당 입모양을 불러오는 방법을 사용하였다. 제안된 방법의 유용성을 확인하기 위하여 텍스트 정보에 따른 다양한 얼굴 동영상을 합성하였으며, PC환경에서 구현 가능한 TTFSI 시스템을 구축하였다.

초·중등 AI 교육을 위한 데이터 리터러시 정의 및 구성 요소 연구 (A Study of the Definition and Components of Data Literacy for K-12 AI Education)

  • 김슬기;김태영
    • 정보교육학회논문지
    • /
    • 제25권5호
    • /
    • pp.691-704
    • /
    • 2021
  • AI 기술의 발달은 우리 삶의 큰 변화를 가져왔다. 생활에서부터 사회, 경제에 이르기까지 AI의 영향력이 커짐에 따라 AI와 데이터 교육에 대한 중요성이 함께 커지고 있다. 이에 OECD 교육 연구 보고서 및 다양한 국내 정보과 교육과정 연구에서 데이터와 데이터 리터러시를 다루고 필수 역량으로 제시하고 있다. 하지만 국내외 관련 연구를 살펴보면 데이터 리터러시에 대한 정의와 구성 요소의 내용과 범위가 연구자에 따라 다른 것을 알 수 있다. 이에 데이터 리터러시 관련 주요 연구의 정의와 구성 요소에 활용된 단어 빈도 분석과 함께 Word2Vec 딥러닝 자연어 처리 방법을 통해 단어의 관계와 의미 유사도를 분석하여 객관적이고 포괄적인 정의와 구성 요소를 제시하였다. 그리고 전문가 검토를 통해 수정 보완하여 데이터 리터러시를 '문제를 해결하기 위해 데이터를 수집하고 분석 및 활용하여 정보로 처리하는 지식 구성과 의사소통의 기초 능력'으로 정의하였으며, '지식, 기능, 가치와 태도'로 각각의 구성 요소를 범주화하였다. 본 연구를 통해 도출된 데이터 리터러시의 정의와 구성 요소가 AI 교육 체계화와 학생들의 미래 역량 관련 교육 연구에 좋은 기초 자료가 될 수 있기를 기대한다.

웹 문서의 의미적 연관성 기술을 위한 온톨로지 에디터 (An Ontology Editor to describe the semantic association about Web Documents)

  • 이무훈;조현규;조현성;조성훈;장창복;최의인
    • 정보처리학회논문지D
    • /
    • 제12D권6호
    • /
    • pp.881-888
    • /
    • 2005
  • 웹의 확산과 더불어 웹상에 존재하는 정보의 양은 예측할 수 없을 정도로 증가하였고, 웹 사용자의 이용수준과 요구 사항도 매우 다양하고 복잡해졌다. 사용자가 원하는 정보와 의미적으로 정확히 일치하는 정보들을 검색하기 위해서는 웹 정보에 대한 정확한 의미 부여와 웹 정보 사이의 의미적 연관성을 기술할 수 있는 지식 표현 수단으로써 온톨로지가 필요하다. 이러한 필요성에 따라 W3C에서는 웹 자원에 대한 의미 표현 기술로 OWL(Web Ontology Language)이라는 웹 온톨로지 언어를 발표하였으나 아직 이를 효과적으로 생성, 편집할 수 있는 전용 에디터(editor)의 개발은 아직 미비한 실정이다. 따라서 본 논문에서는 웹 문서들 간의 의미적 연관성을 기술할 수 있는 OWL을 직관적인 인터페이스(interface)로 생성 및 편집할 수 있도록 OWL Parser, Internal DataModel, Visualization Module을 제공하는 온톨로지 에디터를 설계하고 구현하였다.

온톨로지 구축 및 단어 의미 중의성 해소에의 활용 (Ontology Construction and Its Application to Disambiguate Word Senses)

  • 강신재
    • 정보처리학회논문지B
    • /
    • 제11B권4호
    • /
    • pp.491-500
    • /
    • 2004
  • 본 논문은 기존의 다양한 언어자원들을 이용하여 온톨로지를 구축하고, 이를 단어의미 중의성 해소에 활용하는 방법을 제시하고 있다. 온톨로지를 실용적으로 구축하기 위해서는 가도카와 시소러스의 개념 체계에 격 관계와 기타 의미관계와 같은 다른 의미관계를 추가하여 확장하는 방법을 선택하였다. 구축된 온톨로지를 단어 의미 중의성 해소에 활용하기 위해서는, 결합가 정보를 포함하고 있는 전자사전을 먼저 이용하여 단어의 의미를 결정하고, 결정하지 못한 단어의 의미는 온톨로지를 이용하여 결정하는 절차를 거친다. 이를 위해 온톨로지 내 개념들간의 상호정보가 말뭉치의 통계 정보에 근거하여 계산되는데, 이를 가중치로 간주하면 온톨로지는 가중치 그래프로 생각할 수 있으므로 개념간 경로를 통하여 개념간 연관도를 알아 볼 수 있다. 실제 기계번역 시스템에서 본 방법은 온톨로지를 사용하지 않은 방법보다 9%의 성능 향상을 가져오는 결과를 얻을 수 있었다.

MODIFIED CONVOLUTIONAL NEURAL NETWORK WITH TRANSFER LEARNING FOR SOLAR FLARE PREDICTION

  • Zheng, Yanfang;Li, Xuebao;Wang, Xinshuo;Zhou, Ta
    • 천문학회지
    • /
    • 제52권6호
    • /
    • pp.217-225
    • /
    • 2019
  • We apply a modified Convolutional Neural Network (CNN) model in conjunction with transfer learning to predict whether an active region (AR) would produce a ≥C-class or ≥M-class flare within the next 24 hours. We collect line-of-sight magnetogram samples of ARs provided by the SHARP from May 2010 to September 2018, which is a new data product from the HMI onboard the SDO. Based on these AR samples, we adopt the approach of shuffle-and-split cross-validation (CV) to build a database that includes 10 separate data sets. Each of the 10 data sets is segregated by NOAA AR number into a training and a testing data set. After training, validating, and testing our model, we compare the results with previous studies using predictive performance metrics, with a focus on the true skill statistic (TSS). The main results from this study are summarized as follows. First, to the best of our knowledge, this is the first time that the CNN model with transfer learning is used in solar physics to make binary class predictions for both ≥C-class and ≥M-class flares, without manually engineered features extracted from the observational data. Second, our model achieves relatively high scores of TSS = 0.640±0.075 and TSS = 0.526±0.052 for ≥M-class prediction and ≥C-class prediction, respectively, which is comparable to that of previous models. Third, our model also obtains quite good scores in five other metrics for both ≥C-class and ≥M-class flare prediction. Our results demonstrate that our modified CNN model with transfer learning is an effective method for flare forecasting with reasonable prediction performance.

중학교 '정보' 교과서 '정보의 표현과 관리' 영역 구성의 탐구적 경향 분석 (Analysis of Inquiry Tendency in the 'Information Representation and Management' Sections in Middle School Informatics Textbooks)

  • 김자미;심재권;김지민;이원규;박두순
    • 정보처리학회논문지A
    • /
    • 제19A권1호
    • /
    • pp.9-16
    • /
    • 2012
  • 정보교과에서 정보의 표현과 자료구조에 대한 이해는 컴퓨터과학의 기본원리에 대한 기초단계교육이라 할 수 있다. 그러나 자료구조가 정보교과에서 갖고 있는 교육적 함의나 학생들에게 성찰을 제공하기 위해 어떤 형태로 구성되어야 하는지에 대한 연구는 이루어지지 않았다. 따라서 본 논문은 2007 개정 교육과정을 기초로 제작되어, 2010년부터 사용되고 있는 정보교과서 '정보의 표현과 관리'영역의 탐구적 경향을 분석하였다. Romey 분석법으로 분석한 결과, 본문 분석, 학습자료 분석, 학습활동 분석, 장이나 절에 대한 분석에서 탐구적 경향을 보인 교과서는 1개로 나타났다. 교과서가 지식을 전달하는 데 집중하면, 학생들을 학습에서 소외시킬 수 있다. 특히 정보교과의 경우, IT를 활용한 문제해결에 기저가 되는 교과이므로 학습에서 소외된 학생들은 다양한 문제해결의 과정에서 박탈될 수 있음을 고려해야 한다는 시사점을 제공하였다.

오픈 소스 엣지 컴퓨팅 플랫폼 분석: 구조, 특징, 비교 (Analysis of Open Source Edge Computing Platforms: Architecture, Features, and Comparison)

  • 임헌국;이희진
    • 한국정보통신학회논문지
    • /
    • 제24권8호
    • /
    • pp.985-992
    • /
    • 2020
  • 엣지 컴퓨팅은 데이터를 처리하고 연산하는 곳이 멀리 떨어진 데이터센터에 있는 게 아니라, 단말 장치 혹은 게이트웨이와 같은 엑세스 포인트에 가까운 엣지 사이드에 컴퓨팅 능력 및 데이터 처리 능력을 부가함으로써 저지연/초고속컴퓨팅의 실현을 가능케 한다. 이러한 엣지 컴퓨팅의 종류로는 Mobile edge computing, Fog computing, Cloudlet computing이 있으며, 본 논문에서는 엣지 컴퓨팅을 실제 구현/구축하기 위해 현존하는 오픈 소스 플랫폼들에 대해 초점을 맞추고 분석한다. 각 오픈 소스 엣지 플랫폼에 대해 구조 및 특징들을 체계적으로 묘사하고 비교 분석함으로써 오픈 소스 엣지 플랫폼을 이용하여 실제 엣지 노드를 구축 하고자 하는 산업계 엔지니어들에게 사용 사례에 부합한 최선의 엣지 플랫폼을 선택 할 수 있도록 하나의 제반 지식을 제공하고자 한다.

Strategies to Assess Occupational Exposure to Airborne Nanoparticles: Systematic Review and Recommendations

  • Louis Galey;Sabyne Audignon;Patrick Brochard;Maximilien Debia;Aude Lacourt;Pierre Lambert;Olivier Le Bihan;Laurent Martinon;Sebastien Bau;Olivier Witschger;Alain Garrigou
    • Safety and Health at Work
    • /
    • 제14권2호
    • /
    • pp.163-173
    • /
    • 2023
  • In many industrial sectors, workers are exposed to manufactured or unintentionally emitted airborne nanoparticles (NPs). To develop prevention and enhance knowledge surrounding exposure, it has become crucial to achieve a consensus on how to assess exposure to airborne NPs by inhalation in the workplace. Here, we review the literature presenting recommendations on assessing occupational exposure to NPs. The 23 distinct strategies retained were analyzed in terms of the following points: target NPs, objectives, steps, "measurement strategy" (instruments, physicochemical analysis, and data processing), "contextual information" presented, and "work activity" analysis. The robustness (consistency of information) and practical aspects (detailed methodology) of each strategy were estimated. The objectives and methodological steps varied, as did the measurement techniques. Strategies were essentially based on NPs measurement, but improvements could be made to better account for "contextual information" and "work activity". Based on this review, recommendations for an operational strategy were formulated, integrating the work activity with the measurement to provide a more complete assessment of situations leading to airborne NP exposure. These recommendations can be used with the objective of producing homogeneous exposure data for epidemiological purposes and to help improve prevention strategies.