• 제목/요약/키워드: web database

검색결과 1,527건 처리시간 0.045초

LDA와 BERTopic을 이용한 토픽모델링의 증강과 확장 기법 연구 (Topic Model Augmentation and Extension Method using LDA and BERTopic)

  • 김선욱;양기덕
    • 정보관리학회지
    • /
    • 제39권3호
    • /
    • pp.99-132
    • /
    • 2022
  • 본 연구의 목적은 LDA 토픽모델링 결과와 BERTopic 토픽모델링 결과를 합성하는 방법론인 Augmented and Extended Topics(AET)를 제안하고, 이를 사용해 문헌정보학 분야의 연구주제를 분석하는 데 있다. AET의 실제 적용결과를 확인하기 위해 2001년 1월부터 2021년 10월까지의 Web of Science 내 문헌정보학 학술지 85종에 게재된 학술논문 서지 데이터 55,442건을 분석하였다. AET는 서로 다른 토픽모델링 결과의 관계를 WORD2VEC 기반 코사인 유사도 매트릭스로 구축하고, 매트릭스 내 의미적 관계가 유효한 범위 내에서 매트릭스 재정렬 및 분할 과정을 반복해 증강토픽(Augmented Topics, 이하 AT)을 추출한 뒤, 나머지 영역에서 코사인 유사도 평균값 순위와 BERTopic 토픽 규모 순위에 대한 조화평균을 통해 확장토픽(Extended Topics, 이하 ET)을 결정한다. 최적 표준으로 도출된 LDA 토픽모델링 결과와 AET 결과를 비교한 결과, AT는 LDA 토픽모델링 토픽을 한층 더 구체화하고 세분화하였으며 ET는 유효한 토픽을 발견하였다. AT(Augmented Topics)의 성능은 LDA 이상이었으며 ET(Extended Topics)는 일부 경우를 제외하고 대부분 LDA와 유사한 수준의 성능을 나타내었다.

의류 사이즈별 및 피부톤에 기반을 둔 의류 추천 시스템 (Suitable clothing recommendation system by size and skin color)

  • 박창영;임병찬;이원준;이창수;김민수;이상용
    • 디지털융복합연구
    • /
    • 제20권3호
    • /
    • pp.407-413
    • /
    • 2022
  • 기존 의류 추천 시스템들은 사용자 자신의 신체 촬영 사진이나 신체 사이즈를 입력한 후, 사용자가 좋아하는 의류의 종류를 선택하면 그에 적합한 사진을 보여주는 수준에 머물러 있다. 이러한 추천 시스템을 이용하여 사용자가 의류를 구매할 경우, 사용자의 신체 사이즈에 맞지 않거나 어울리지 않는 경우가 다수 발생하게 된다. 본 연구에서는 기존 의류 추천 시스템들의 이런 문제점을 해결하기 위하여 사용자가 사이즈 뿐만 아니라 피부톤을 입력받아 사용자의 신체 사이즈 뿐만 아니라 피부톤에 알맞는 의류를 추천하는 시스템을 구현하였다. 본 시스템은 의류 추천을 위해 남성 상의 8가지를 대상으로 웹 크롤링을 통해 얻은 의류의 사이즈 정보를 주기적으로 데이터베이스에 저장하고, 해당 의류 이미지의 전체 픽셀을 분석하여 색감 텍스트 값을 추출하였다. 본 시스템의 성능을 확인하기 위하여 남자 대학생 100명을 대상으로 설문 조사를 실시하였으며, 70% 수준의 만족도를 보였다. 만족하지 않는 대부분의 이유는 추천 대상 의류가 한정되어 있다고 밝혀서 추후 대상 의류의 확대가 필요할 것으로 판단된다.

The Philippines Coconut Genomics Initiatives: Updates and Opportunities for Capacity Building and Genomics Research Collaboration

  • Hayde Flandez-Galvez;Darlon V. Lantican;Anand Noel C. Manohar;Maria Luz J. Sison;Roanne R. Gardoce;Barbara L. Caoili;Alma O. Canama-Salinas;Melvin P. Dancel;Romnick A. Latina;Cris Q. Cortaga;Don Serville R. Reynoso;Michelle S. Guerrero;Susan M. Rivera;Ernesto E. Emmanuel;Cristeta Cueto;Consorcia E. Reano;Ramon L. Rivera;Don Emanuel M. Cardona;Edward Cedrick J. Fernandez ;Robert Patrick M. Cabangbang;Maria Salve C. Vasquez;Jomari C. Domingo;Reina Esther S. Caro;Alissa Carol M. Ibarra;Frenzee Kroeizha L. Pammit;Jen Daine L. Nocum;Angelica Kate G. Gumpal;Jesmar Cagayan;Ronilo M. Bajaro;Joseph P. Lagman;Cynthia R. Gulay;Noe Fernandez-Pozo;Susan R. Strickler;Lukas A. Mueller
    • 한국작물학회:학술대회논문집
    • /
    • 한국작물학회 2022년도 추계학술대회
    • /
    • pp.30-30
    • /
    • 2022
  • Philippines is the second world supplier of coconut by-products. As its first major genomics project, the Philippine Genome Center program for Agriculture (PGC-Agriculture) took the challenge to sequence and assemble the whole coconut genome. The project aims to provide advance genetics tools for our collaborating coconut researchers while taking the opportunity to initiate local capacity. Combination of different NGS platforms was explored and the Philippine 'Catigan Green Dwarf' (CATD) variety was selected with the breeders to be the crop's reference genome. A high quality genome assembly of CATD was generated and used to characterize important genes of coconut towards the development of resilient and outstanding varieties especially for added high-value traits. The talk will present the significant results of the project as published in various papers including the first report of whole genome sequence of a dwarf coconut variety. Updates will include the challenges hurdled and specific applications such as gene mining for host insect resistance and screening for least damaged coconuts (thus potentially insect resistant varieties). Genome-wide DNA markers as published and genes related to coconut oil qualitative/quantitative traits will also be presented, including initial molecular/biochemical studies that support nutritional and medicinal claims. A web-based genome database is currently built for ease access and wider utility of these genomics tools. Indeed, a major milestone accomplished by the coconut genomics research team, which was facilitated with the all-out government support and strong collaboration among multidisciplinary experts and partnership with advance research institutes.

  • PDF

벼 재배용 사물인터넷 기반 물꼬 구현 (Implementation of IoT-Based Irrigation Valve for Rice Cultivation)

  • 이병한;성덕경;진영민;황연현;김영광
    • 사물인터넷융복합논문지
    • /
    • 제9권6호
    • /
    • pp.93-98
    • /
    • 2023
  • 벼농사에서 물 관리는 매우 중요한 작업이다. 벼의 생육 초기에는 잡초 발생을 억제하기 위하여 물을 깊이 대고, 모내기 후 뿌리가 활착하면 줄기 생성을 촉진하기 위해 물을 얕게 대며, 쌀알이 맺힐 수 없는 줄기가 생성되는 시기에는 물을 뗀다. 물 공급 상황은 논 위치, 농수로, 토양, 기상 등 다양한 요소에 영향을 받기 때문에 농민은 수시로 논을 방문하여 수위를 확인하고 물의 유출입을 통제한다. 경작하는 논이 원격지에 분산되어 있다면 이러한 노력은 더욱 증가한다. 자동 물 관리 시스템은 노동력을 절감하여 생산성 향상에 기여할 수 있는 방안으로 고려되고 있다. 그러나 2022년 국내 벼 생산으로 인한 순수익은 평균 32만원/10a 정도이다. 따라서 높은 단가의 고사양 장치를 적용하거나 공사를 추진하여 관련 인프라를 구축하는 것은 현실적으로 어렵다. 본 연구는 추가적인 기반공사 없이 국내 농업 인프라에 통합될 수 있는 물꼬 개발에 중점을 두었으며 세 가지 주요 분야에서 연구를 수행하여 사물인터넷 기반 물꼬를 구현하였다. 첫째, 기존의 농업용 관수 파이프에 빠르고 쉽게 설치할 수 있는 물꼬를 설계하였다. 둘째, 저전력 통신 기능을 갖춘 Cat M1 통신 모뎀과 아두이노 나노 보드를 연결하고 전원을 공급하는 전자회로를 제작하였다. 셋째, 클라우드 기반 플랫폼을 이용하여 서버와 데이터베이스 환경을 구축하고 사용자가 접근할 수 있는 웹 페이지를 제작하였다.

XMLA를 사용한 OLAP과 데이타 마이닝 분석이 가능한 리포팅 툴의 구현 (Implementation of Reporting Tool Supporting OLAP and Data Mining Analysis Using XMLA)

  • 최지웅;김명호
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제15권3호
    • /
    • pp.154-166
    • /
    • 2009
  • 기업 운영에서 발생하는 데이타의 수집과 통합에서부터 의사결정을 위한 정보의 분석 및 그 결과로의 접근을 제공하기 위한 BI 환경에서 최종 사용자들을 위한 프론트-엔드 툴로서는 데이터베이스 쿼리 및 리포팅 툴, OLAP 툴, 데이타 마이닝 툴이 대표적이다. 데이타베이스 쿼리 및 리포팅 툴은 SQL 쿼리 결과 셋을 반영하는 워드프로세서가 생성하는 문서 수준의 정교한 동적 문서의 생성과 웹 환경을 통한 문서 배포 능력이 장점이지만 데이타 소스가 RDBMS로 제한되어 있다. 반면, OLAP 툴과 데이타 마이닝 툴은 각기 고유한 방식으로 데이타를 분석할 수 있는 능력은 강력하지만 차트와 표 등의 제한적인 컴포넌트들만으로 분석 결과를 제공할 수 있다는 한계를 가지고 있다. 본 논문에서는 상호 보완적으로 사용될 수 있는 BI 환경을 위한 프론트-엔드 툴들을 통합하였다. 본 논문에서 제안하는 리포팅 툴은 RDBMS에서 데이타를 추출하기 위한 SQL 기반의 쿼리 편집기만을 내장한 기존의 리포팅 툴과 달리 OLAP과 데이타 마이닝을 위한 쿼리 편집기를 추가하여 OLAP과 데이타 마이닝 서버로부터도 데이터를 추출할 수 있다. 그리고 기존의 리포팅 툴은 동일한 문서를 다수의 사용자들이 조회하는 상황에서 반복된 문서 생성을 피하기 위하여 서버 측에서 문서를 생성하는 구조를 갖지만 이 시스템은 다수의 사용자들을 위한 문서배포 목적이 아닌 사용자들이 데이타 분석 목적으로 서로 다른 문서를 생성하는 상황에 적합하도록 서버 측에 비해 제한된 리소스 환경을 갖는 클라이언트 측에서 동작하는 리포트 뷰어에서 대량의 데이타를 포함하는 문서를 생성할 수 있는 구조와 처리방식을 갖고 있다. 또한 이 시스템에서 접근하는 세가지 종류의 데이타 소스에서 추출한 데이타들을 연계하여 하나의 문서에서 통합할 수 있도록 하는 자료구조를 갖추고 있다. 마지막으로 이 시스템은 특정 벤더의 OLAP과 데이타 마이닝 서버에 종속적으로 동작하지 않기 위하여 웹 서비스 기반의 XMLA를 이들 서버와의 통신 프로토콜로써 선택하였다.

중장년층 일자리 요구사항 분석 및 인력 고용 매칭 시스템 개발 (Job Preference Analysis and Job Matching System Development for the Middle Aged Class)

  • 김성찬;장진철;김성중;진효진;이문용
    • 지능정보연구
    • /
    • 제22권4호
    • /
    • pp.247-264
    • /
    • 2016
  • 저출산 및 인구 고령화가 가속화되면서, 중장년 퇴직자 등 노동 소외 계층의 취업난 해결은 우리 사회의 핵심 과제로 등장하고 있다. 온라인에는 수많은 일자리 요구 정보가 산재해 있으나, 이를 중장년 구직자에게 제대로 매칭시키지는 못하고 있다. 워크넷 취업 로그에 따르면 구직자가 선호하는 직종에 취업하는 경우는 약 24%에 불과하다. 그러므로, 이러한 문제를 극복하기 위해서는 구직자에게 일자리 정보를 매칭시킬 때 선호하는 직종과 유사한 직종들을 추천하는 소프트 매칭 기법이 필수적이다. 본 연구는 중장년층에 특화된 소프트 직업 매칭 알고리즘과 서비스를 고안하고 개발하여 제공하는 것을 목표로 한다. 이를 위하여 본 연구에서는 1) 대용량의 구직 활동 기록인 워크넷 로그로부터 중장년층의 일자리 특성 및 요구 추세를 분석하였다. 2) 중장년층의 일자리 추천을 위해 직종 유사도 기준으로 일자리 분류표(KOCM)를 재정렬하였다. 이 결과를 이용하여, 3) 중장년에 특화된 인력 고용 소프트 매칭 직업 추천 알고리즘(MOMA)을 개발하여 구인 구직 웹사이트에 적용하였다. 자체 저작한 중장년층 특화 일자리 분류표(KOCM)를 이용한 소프트 일자리 매칭 시스템의 정확도를 측정하였을 때, 실제 고용 결과 기준, 하드 매칭 대비 약 20여 배의 성능 향상을 보였다. 본 연구내용을 적용하여 개발한 중장년층 특화 구직 사이트는 중장년층의 구직 과정에서 입력 정보 부담을 최소화하고 소프트 매칭을 통해 사용자의 요구직종에 적합한 일자리를 정확하고 폭넓게 추천함으로 중장년층의 삶의 질 향상에 기여할 수 있을 것으로 기대된다.

건강기능식품 안전관리 연구방향 (Research Direction for Functional Foods Safety)

  • 정기화
    • 한국식품위생안전성학회지
    • /
    • 제25권4호
    • /
    • pp.410-417
    • /
    • 2010
  • 건강효과나 보건효과를 표방한 다양한 건강기능식품이 시장에 유통되고 있다 이들 제품은 분명한 식품형태의 것으로부터 정체, 캡슐 상 까지여서 의약품과 오인 혼동될 우려가 높으며 전문적 지식이 없는 사람이 통상의 식품으로서 판매하고 있는 일이 많고 건강기능식품용 질병의 치료 목적으로 사용하는 경우도 적지 않다. 건강기능식품제도의 창설이나 법적 규제에 의해 혼란스런 건강기능식품의 상황을 개선하기 위한 노력이 계속되어 왔지만 아직 소비자에게는 제대로 전달되지 않고 있다. 따라서 건강기능식품이 질병의 치료에 이용되는 문제나 위법으로 의약품성분을 첨가한 제품이 유통되는 문제는 끊이지 않고 있고 이러한 문제는 인터넷 등의 정보 전달수단의 발달에 따라 더욱 확대되고 있다. 건강기능식품의 문제는 제품자체의 문제와 이용방법의 문제로 크게 나눌 수 있지만 어느 쪽이나 적절한 정보를 소비자에게 전달해서 그 실태가 틀림없이 인식되어야만 어느 정도 개선 헬 수 있다고 생각된다. 건강가능식품과 관련되어 야기 될 수 있는 문제들은 위법제품, 유해물질 혼입, 알레르기 병자에 대한 투여시 고려되어야 할 사항, 의약품과의 상호작용, 성분표시가 있어도 그 순도와 함량이 극히 애매해 검출되지 않을 수도 있는 문제, 대사활성화가 일어나는 제품, Alkaloid가 함유된 경우 및 비타민 미네랄의 과잉섭취와 부족에 의한 건강피해 리스크 등 많은 경우가 있다. 건강기능식품과 관련한 부작용 사례가 해마다 증가하고 있는 이유는 불량 건강기능식품 업체가 그 효과와 효능을 과장해서 선전하는 것도 중요한 부분을 차지하며 실제로 허위 과대 광고로 인해 적발된 사례가 연평균 821건에 달한다. 식품의약품안전청은 홈페이지를 통해 건강기능식품 문제의 개선과 홍보를 위해 정보를 제공하고 있지만 건강기능 식품의 적정사용과 의약품 건강기능식품 간 상호작용을 피하기 위해서는 개선의 여지가 있다. 건강기능식품문제의 개선을 위해서는 승인된 제품에 대한 정보 부작용 수집의 제도화 및 재평가 제도의 정착, 인체적용 전 시험과 인체적용 시험조건에 대한 표준화가 시급하다. 또한 적절한 정보제공 활동을 위해서는 건강기능식품 의약품 등 이종 데이터간의 유기적 연동을 위한 통합 DB시스템 및 사용자가 데이터를 편리하게 검색할 수 있는 사용자 인터페이스도 요망된다.

발생 간격 기반 가중치 부여 기법을 활용한 데이터 스트림에서 가중치 순차패턴 탐색 (Finding Weighted Sequential Patterns over Data Streams via a Gap-based Weighting Approach)

  • 장중혁
    • 지능정보연구
    • /
    • 제16권3호
    • /
    • pp.55-75
    • /
    • 2010
  • 일반적인 순차패턴 마이닝에서는 분석 대상 데이터 집합에 포함되는 구성요소의 발생 순서만을 고려하며, 따라서 단순 순차패턴은 쉽게 찾을 수 있는 반면 실제 응용 분야에서 널리 활용될 수 있는 관심도가 큰 순차패턴을 탐색하는데 한계가 있다. 이러한 단점을 보완하기 위한 대표적인 연구 주제들 중의 하나가 가중치 순차패턴 탐색이다. 가중치 순차패턴 탐색에서는 관심도가 큰 순차패턴을 얻기 위해서 구성요소의 단순 발생 순서 뿐만 아니라 구성요소의 가중치를 추가로 고려한다. 본 논문에서는 발생 간격에 기반 한 순차패턴 가중치 부여 기법 및 이를 활용한 순차 데이터 스트림에 대한 가중치 순차패턴 탐색 방법을 제안한다. 발생 간격 기반 가중치는 사전에 정의된 별도의 가중치 정보를 필요로 하지 않으며 순차정보를 구성하는 구성요소들의 발생 간격으로부터 구해진다. 즉, 순차패턴의 가중치를 구하는데 있어서 구성요소의 발생순서와 더불어 이들의 발생 간격을 고려하며, 따라서 보다 관심도가 크고 유용한 순차패턴을 얻는데 도움이 된다. 한편, 근래 대부분의 컴퓨터 응용 분야에서는 한정적인 데이터 집합 형태가 아닌 데이터 스트림 형태로 정보를 발생시키고 있다. 이와 같은 데이터 생성 환경의 변화를 고려하여 본 논문에서는 순차 데이터 스트림을 마이닝 대상으로 고려하였다.

현대인의 식습관 문제점 인지와 발생 질병극복을 위한 대안 제시: 5대 블루존 중 미국 로마린다 지역을 중심으로 (A Study on the Problems of Eating Habits of Mordern People and Suggesting Alternatives to Overcome Diseases: A Review of the Five Blue Zones, Based on the Roma Linda Region in the USA)

  • 신경옥;제해종
    • 한국신경인지재활치료학회지
    • /
    • 제10권2호
    • /
    • pp.53-62
    • /
    • 2018
  • 목적: 본 연구는 현대인의 식습관 문제점 인지와 발생 질병극복을 위한 대안을 제시하기 위해 로마린다에 거주하는 사람들의 질병 발병률 감소가 식습관이 미치는 영향 대한 선행연구를 조사하는 방식으로 이루어졌다. 방법: 본 연구의 기간은 2016년 5월 1일부터 2018년 2월 28일까지 이루어졌다. 문헌 검색은 database로서 Pubmed와 국내 각각의 학회 사이트를 활용하였다. 잘못된 식습관의 인지를 바탕으로 식습관에 따른 질병의 종류를 분류하여 서술하였다. 본 논문은 분석된 데이터를 통해 객관적으로 해석하고 결론을 유추하였다. 총 100여 편 이상을 선정하여 그 중 60여 편의 논문과 데이터베이스를 가지고 총설을 작성하였다. 결과: 로마린다에 거주하는 사람들은 균형진 영양섭취, 충분한 운동, 적절한 수분 섭취, 햇빛 쬐기, 절제(알코올 등 절제), 신선한 공기, 적절한 휴식, 그리고 신뢰 등을 기초로 한 영양교육을 철저히 실천하고 있다. 로마린다에 거주하는 사람들의 대부분은 생활습관 중 특별히 균형 잡힌 영양섭취에 해당하는 식습관은 채소, 과일, 견과류를 충분히 섭취하는 채식위주의 식사를 포함한다. 로마린다에 거주하는 사란들은 다른 곳에 거주하는 사람들에 비해 관상동맥 심장병과 암 발병률이 낮은데, 그것의 직접적인 이유로는 건강한 채식위주의 식습관과 금연, 금주 등을 강조하는 절제생활 및 운동에 대한 인지를 통해 활동량의 증가 등을 꼽는다. 건강한 삶의 여러 요인 중 이 논문이 살펴본 중요한 부분은 식습관인데, 이는 올바른 식습관이 건강한 삶과 직결돼 있고, 좋지 못한 식습관이 많은 질병의 원인이 되기 때문이다. 많은 선행연구들이 대부분의 만성퇴행성질환은 나쁜 식습관과 스트레스에서 기인함을 이미 밝혀냈다. 결론: 지역공동체의 식습관을 연구의 대상으로 삼은 이유는 그들의 생활습관이 건강한 삶에 관심을 가진 현대인에게 주는 메시지가 있기 때문이다. 영양교육을 통해 건강하게 사는 사람들의 생활습관, 특별히 로마린다에 거주하는 사람들의 식습관을 살펴보는 것은 건강한 삶을 추구하고자 하는 현대인들에게 중요한 배움의 기회가 될 것이다. 또한 현대인이 자신의 식습관을 올바르게 인식하여 식행동의 변화를 유도한다면, 질병에 대한 발병률을 감소시키고, 건강한 삶을 영위할 수 있을 것으로 사료된다.

구인구직사이트의 구인정보 기반 지능형 직무분류체계의 구축 (Development of Intelligent Job Classification System based on Job Posting on Job Sites)

  • 이정승
    • 지능정보연구
    • /
    • 제25권4호
    • /
    • pp.123-139
    • /
    • 2019
  • 주요 구인구직사이트의 직무분류체계가 사이트마다 상이하고 SW분야에서 제안한 'SQF(Sectoral Qualifications Framework)'의 직무분류체계와도 달라 SW산업에서 SW기업, SW구직자, 구인구직사이트가 모두 납득할 수 있는 새로운 직무분류체계가 필요하다. 본 연구의 목적은 주요 구인구직사이트의 구인정보와 'NCS(National Competaency Standars)'에 기반을 둔 SQF를 분석하여 시장 수요를 반영한 표준 직무분류체계를 구축하는 것이다. 이를 위해 주요 구인구직사이트의 직종 간 연관분석과 SQF와 직종 간 연관분석을 실시하여 직종 간 연관규칙을 도출하고자 한다. 이 연관규칙을 이용하여 주요 구인구직사이트의 직무분류체계를 맵핑하고 SQF와 직무 분류체계를 맵핑함으로써 데이터 기반의 지능형 직무분류체계를 제안하였다. 연구 결과 국내 주요 구인구직사이트인 '워크넷,' '잡코리아,' '사람인'에서 3만여 건의 구인정보를 open API를 이용하여 XML 형태로 수집하여 데이터베이스에 저장했다. 이 중 복수의 구인구직사이트에 동시 게시된 구인정보 900여 건을 필터링한 후 빈발 패턴 마이닝(frequent pattern mining)인 Apriori 알고리즘을 적용하여 800여 개의 연관규칙을 도출하였다. 800여 개의 연관규칙을 바탕으로 워크넷, 잡코리아, 사람인의 직무분류체계와 SQF의 직무분류체계를 맵핑하여 1~4차로 분류하되 분류의 단계가 유연한 표준 직무분류체계를 새롭게 구축했다. 본 연구는 일부 전문가의 직관이 아닌 직종 간 연관분석을 통해 데이터를 기반으로 직종 간 맵핑을 시도함으로써 시장 수요를 반영하는 새로운 직무분류체계를 제안했다는데 의의가 있다. 다만 본 연구는 데이터 수집 시점이 일시적이기 때문에 시간의 흐름에 따라 변화하는 시장의 수요를 충분히 반영하지 못하는 한계가 있다. 계절적 요인과 주요 공채 시기 등 시간에 따라 시장의 요구하는 변해갈 것이기에 더욱 정확한 매칭을 얻기 위해서는 지속적인 데이터 모니터링과 반복적인 실험이 필요하다. 본 연구 결과는 향후 SW산업 분야에서 SQF의 개선방향을 제시하는데 활용될 수 있고, SW산업 분야에서 성공을 경험삼아 타 산업으로 확장 이전될 수 있을 것으로 기대한다.