• 제목/요약/키워드: Jaccard

검색결과 90건 처리시간 0.04초

아까시나무(Robinia pseudo-acacia)종자 단백질의 전기 영동 변이

  • 김창호;이호준;김용옥
    • The Korean Journal of Ecology
    • /
    • 제16권4호
    • /
    • pp.515-526
    • /
    • 1993
  • 한반도 남부 지역에 분포하는 아까시나무(Robinia pseudo-acacia L.)종자의 생태학적 형질변이를 추적하기 위하여, 북위34$^{\circ}$18'~38$^{\circ}$36'사이에 위치한 15개 지역(대진, 속초, 강릉, 수락산, 홍천, 광릉, 남한산성, 충주, 예산, 안동, 전주, 달성, 창원, 목포, 완도)을 선정하여 채종한 종자를 재료로, 단백질 패턴 및 정량 분석을 실시하였다. SDS-PAGE에 의한 단백질 패턴 분석결과, 전 지역데 걸쳐 총 35개의 밴드가 분리되었으며 최고 분자량은 142,232 daltons, 최저 분자량은 17,258 daltons였다. 분리된 단백질 밴드 수를 지역별로 비교한 결과, 대진, 속초가 32개로 가장 많은 반면, 홍천과 달성은 23개로 가장 적었으며, 대체로 고위도로 갈수록 증가하는 경향을 나타냈다. 각 단백질 밴드의 유무에 따라 지역에 따른 단백질 패턴의 차이를 비교해 본 결과, 중북부 동해안형(대진, 속초, 강릉)과 중부형(수락산, 홍천, 광릉, 남한산성, 충주) 및 남부형(에산, 안동, 전주, 달성, 창원, 목포, 완도)등 3가지 지역 유형이 구분되었다. 단백질 패턴의 지역간 유사도 지수(Jaccard 계수)를 근거로 UPGMAdp 의한 cluster analysis 결과, 중북부 등해안형(속초, 강릉), 중북부 I형(수락산, 홍천), 중북부 II형(남한산성, 충주, 대진), 중북부III형(광릉), 중남부형(예산, 달성, 전주) 및 남부형(안동, 창원, 목포, 완도)등 6개 유형이 식별되었다. 분리된 단백질 밴드 가운데, 모든 지역세어 No.12밴드(78,162daltons)가 가장 높은 염색 강도를 나타냈고, No.11.12.13.과No.23~28 밴드 역시 비교적 높은 염색강도를 보였다. 전체적으로 총 단백질 함량이 높은 창원, 목포, 완도 등 남부형 지역에서 특히 높은 염색 강도를 나타냈다. 총 단백질 함량은 각 지역별로 최저9.68mg/g(수락산)에서 최고17.30mg/g(전주)에 이르는 다양한 수치를 나타냈으며, 대체로 저위도로 갈수록 증가하는 경향을 보였다.

  • PDF

Microsatellite 마커를 이용한 오이 유통품종 DNA Profile Data Base 구축 (Construction of a DNA Profile Database for Commercial Cucumber (Cucumis sativus L.) Cultivars Using Microsatellite Marker)

  • 권용삼;최근진
    • 원예과학기술지
    • /
    • 제31권3호
    • /
    • pp.344-351
    • /
    • 2013
  • 국내에서 유통되고 있는 오이 110 품종을 대상으로 microsatellite 마커를 이용하여 DNA profile 데이터베이스를 구축하기 위하여 품종식별력이 높은 분자 마커의 선정 및 이를 활용한 품종간 유전적 유사도 검정 등에 대한 연구를 수행하였다. 오이 11 품종을 358개의 microsatellite 마커로 검정하여 31개의 다형성이 높은 마커를 선정한 다음 110품종에 대한 DNA profile 데이터베이스를 구축하였다. 오이 110품종을 31개의 microsatellite 마커로 분석하였을 때 대립유전자의 수는 2-9개로 비교적 다양한 분포를 나타내었으며 전체 139개의 대립유전자가 분석되었다. PIC 값은 0.253-0.873 범위에 속하였으며 평균값은 0.610으로 나타났다. Microsatellite 마커들의 대립유전자를 이용하여 계통도를 작성하였을 때 110 품종이 과실의 형태에 따라 그룹화되는 것을 확인하였으며, 대부분이 품종이 microsatellite 마커의 유전자형에 의해 식별이 되는 것으로 나타났다. 이 연구결과에 의해 개발된 오이 품종별 DNA profile 데이터베이스는 품종보호 출원 품종의 선 DNA 검정을 통한 대조품종 선정, 구별성, 균일성, 안정성 확인에 매우 유용하게 이용할 수 있어 향후, 품종보호권 강화 등에 크게 기여할 수 있을 것으로 사료된다.

Microsatellite Marker를 이용한 멜론 시판품종의 품종식별과 F1 순도검정 (Use of Microsatellite Markers to Identify Commercial Melon Cultivars and for Hybrid Seed Purity Testing)

  • 권용삼;홍지화
    • 원예과학기술지
    • /
    • 제32권4호
    • /
    • pp.525-534
    • /
    • 2014
  • Microsatellite 표지를 이용하여 국내에서 시판되고 있는 멜론 58품종의 식별과 멜론 육종 계통 '10H08'을 이용하여 $F_1$ 종자 순도를 평가하였다. 412개의 microsatellite 표지 중 다형성 정도가 높은 29개는 품종 그룹 내에서도 다양한 유전 변이를 나타내었으며 분자표지의 유전자형에 의해 모든 품종을 식별할 수 있었다. Microsatellite 표지의 대립유전자를 이용하여 멜론 58품종에 대한 계통도를 작성하였을 때 멜론의 형태적 특성과 일치하면서 2개의 대그룹으로 구분되었다. $F_1$ 종자의 순도 검정에 microsatellite 표지를 활용하기 위하여 29개의 표지를 '10H08' 계통의 양친에 대하여 검정하였을 때 5개의 프라이머가 다형성을 보였으며, 이 중 한 개의 프라이머 'CMGAN12'는 양친간에 뚜렷한 다형성 밴드를 나타내었다. 이 프라이머를 192개의 $F_1$ 종자에 대하여 검정하였을 때 자식주로 보이는 개체가 분석된 종자 내에서 명확하게 구분되었다. 본 연구 결과에서 선정된 멜론 품종 식별용 microsatellite 표지는 멜론 품종의 지문화뿐만 아니라 $F_1$ 종자의 순도 검정이 가능하여 종자회사에서 매우 유용하게 활용될 수 있는 것으로 나타났다.

유통 중인 고추 품종에 대한 Microsatellite 마커 Data Base 구축 (Construction of a Microsatellite Marker Database of Commercial Pepper Cultivars)

  • 권용삼;홍지화;최근진
    • 원예과학기술지
    • /
    • 제31권5호
    • /
    • pp.580-589
    • /
    • 2013
  • 국내에서 최근에 유통되고 있는 고추 170품종을 대상으로 microsatellite 마커를 이용하여 DNA 프로파일 데이터베이스를 구축하기 위하여 품종식별력이 높은 분자표지의 선정 및 이를 활용한 품종 식별력 및 유전적 유사도 검정 등에 대한 연구를 수행하였다. 고추 형태적 특성이 다른 11품종을 302개의 microsatellite 마커로 검정하여 24개의 다형성이 높은 마커를 선정한 다음 170품종에 대한 DNA 프로파일 데이터베이스를 구축하였다. 고추 170품종을 24개의 microsatellite 마커로 분석하였을 때 마커당 평균 대립유전자수는 6.83개로 나타났고, 최소 2개부터 15개까지 다양한 분포를 나타내었다. PIC 값의 경우 0.324-0.873 범위에 속하였으며 평균값은 0.673으로 높게 나타났다. Microsatellite 마커의 대립유전자를 이용하여 고추 170품종에 대한 계통도를 작성하였을 때 과실의 형태에 따라 3개의 그룹으로 크게 나누어졌으며 모든 품종이 microsatellite 마커의 유전자형에 의해 식별이 되는 것으로 나타났다. 이 연구결과에 의해 개발된 고추 품종별 DNA 프로파일 데이터베이스는 품종보호출원 품종의 선 DNA 검정을 통한 대조품종 선정, 구별성, 균일성, 안정성의 재확인에 매우 유용하게 이용되어질 수 있어 향후, 품종보호권 강화 등에 크게 기여할 수 있을 것으로 사료된다.

수박 시판 품종의 식별을 위한 Genomic과 Expressed Sequence Tag (EST)에서 유래된 Microsatellite Marker의 이용 (Use of Microsatellite Markers Derived from Genomic and Expressed Sequence Tag (EST) Data to Identify Commercial Watermelon Cultivars)

  • 권용삼;홍지화;김두현;김도훈
    • 원예과학기술지
    • /
    • 제33권5호
    • /
    • pp.737-750
    • /
    • 2015
  • 국내에서 시판되고 있는 수박 102 품종에 대한 DNA 프로 파일 데이터베이스를 구축하기 위하여 genomic microsatellite(gMS)와 expressed sequence tag(EST) microsatellite(eMS) 마커의 다형성 정도의 비교와 유전적 연관성 분석을 통한 품종식별력 검정 등에 대한 일련의 연구를 수행하였다. 수박 gMS 마커를 이용하여 국내에서 시판되고 있는 수박 102 품종을 검정하였을 때 마커당 3.63개의 평균 대립유전자가 검출되었으며, 평균 PIC 값은 0.479로 나타났다. 이에 반해 eMS 마커는 평균 대립유전자의 수가 2.50개, PIC 값이 0.425로 나타나 gMS 마커보다 다형성 정도가 낮게 나타났다. gMS와 eMS 및 이들 두 종류의 마커를 병합하여 작성된 계통도는 microsatellite 마커의 다형성에 따라 수박 102개 품종을 6-8개의 그룹으로 구분하였고 대부분의 품종의 식별이 가능하였다. 3가지 마커 유형에 따라 작성된 계통도를 Mantel test에 의해 상관 정도를 분석하였을 때 높은 상관($r{\geq}0.80$)을 나타내었다. 따라서 본 연구에 활용된 microsatellite 마커는 수박 유전자원의 특성평가, 순도검정 및 품종의 지문화 작업의 수단으로 유용하게 활용될 수 있을 것이다.

단어 임베딩 및 벡터 유사도 기반 게임 리뷰 자동 분류 시스템 개발 (Development of An Automatic Classification System for Game Reviews Based on Word Embedding and Vector Similarity)

  • 양유정;이보현;김진실;이기용
    • 한국전자거래학회지
    • /
    • 제24권2호
    • /
    • pp.1-14
    • /
    • 2019
  • 게임은 소프트웨어 특성상 출시 후 사용자들의 반응을 빠르게 파악하여 개선하는 것이 중요하다. 하지만 구글 플레이 앱 스토어 등 사용자들이 게임을 다운로드하고 리뷰를 올릴 수 있는 대부분의 사이트들은 게임 리뷰에 대한 매우 제한적이고 모호한 분류 기능만을 제공한다. 따라서 본 논문에서는 사용자들이 사이트에 올린 게임 리뷰를 보다 명확하고 운영에 유용한 주제들로 자동 분류하는 시스템을 개발한다. 본 논문에서 개발한 시스템은 리뷰에 포함된 단어들을 대표적인 단어 임베딩 모델인 word2vec을 사용하여 벡터들로 변환하고, 이 벡터들과 각 주제 간 유사도를 측정하여 해당 리뷰를 관련된 주제로 분류한다. 특히 분류 성능에 직접적인 영향을 미치는 벡터 간 유사도 측정 방법을 선택하기 위해 본 연구에서는 대표적인 벡터 간 유사도 측정 방법인 유클리디안 유사도, 코사인 유사도, 확장된 자카드 유사도의 성능을 실제 데이터를 사용하여 비교하였다. 또한 어떤 리뷰가 둘 이상의 주제에 해당하는 경우를 위해 임계값에 기반한 다중 분류 방법을 사용하였다. 구글 플레이 앱스토어의 실제 데이터를 사용한 실험 결과 본 시스템은 95%까지의 정확도를 보임을 확인하였다.

인공지능 기반 평가 도구를 이용한 한의사의 체질 진단 평가 및 활용 방안에 대한 연구 (Research on the Evaluation and Utilization of Constitutional Diagnosis by Korean Doctors using AI-based Evaluation Tool)

  • 박무순;황민우;이정윤;김창업;권영규
    • 동의생리병리학회지
    • /
    • 제36권2호
    • /
    • pp.73-78
    • /
    • 2022
  • Since Traditional Korean medicine (TKM) doctors use various knowledge systems during treatment, diagnosis results may differ for each TKM doctor. However, it is difficult to explain all the reasons for the diagnosis because TKM doctors use both explicit and implicit knowledge. In this study, an upgraded random forest (RF)-based evaluation tool was proposed to extract clinical knowledge of TKM doctors. Also, it was confirmed to what extent the professor's clinical knowledge was delivered to the trainees by using the evaluation tool. The data used to construct the evaluation tool were targeted at 106 people who visited the Sasang Constitutional Department at Kyung Hee University Korean Medicine Hospital at Gangdong. For explicit knowledge extraction, four TKM doctors were asked to express the importance of symptoms as scores. In addition, for implicit knowledge extraction, importance score was confirmed in the RF model that learned the patient's symptoms and the TKM doctor's constitutional determination results. In order to confirm the delivery of clinical knowledge, the similarity of symptoms that professors and trainees consider important when discriminating constitution was calculated using the Jaccard coefficient. As a result of the study, our proposed tool was able to successfully evaluate the clinical knowledge of TKM doctors. Also, it was confirmed that the professor's clinical knowledge was delivered to the trainee. Our tool can be used in various fields such as providing feedback on treatment, education of training TKM doctors, and development of AI in TKM.

A Tracking Method of Same Drug Sales Accounts through Similarity Analysis of Instagram Profiles and Posts

  • Eun-Young Park;Jiyeon Kim;Chang-Hoon Kim
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권2호
    • /
    • pp.109-118
    • /
    • 2024
  • 전 세계 소셜 미디어 사용자가 증가하면서 다양한 범죄의 수단으로 소셜 미디어가 악용되는 사례가 증가하고 있다. 특히, 소셜 미디어를 통한 마약 유통은 마약 판매자와 소비자의 높은 접근성으로 인해 청소년들의 마약 호기심을 자극하고, 구매를 용이하게 한다는 점에서 심각한 사회문제로 대두되고 있다. 본 논문에서는 다양한 소셜 미디어 중, 국내 19세에서 24세 청소년이 가장 많이 사용하는 인스타그램을 대상으로 프로필 사진, 소개글, 게시물 사진과 게시글을 수집하고, 각 정보의 유사도 분석을 통해 수집한 다수의 계정을 활용하여 마약을 유통하는 마약사범 추적 기술을 개발한다. 4개 수집 정보 중, 이미지 형태의 프로필 사진 및 게시물 사진은 SSIM(Structural Similarity Index Measure) 기반으로 유사도를 분석하고, 텍스트 형태의 소개글 및 게시글은 자카드 유사도 및 코사인 유사도 기법을 사용하여 유사도를 분석한다. 이와 같은 유사도 분석을 통해, 각 수집 정보별 계정 간의 유사도를 측정할 수 있으며 유의수준 이상의 유사성을 갖는 계정들에 대해 동일 마약 유통 계정으로 판단할 수 있다. 또한, 수집한 4개 정보에 대해 로지스틱 회귀분석을 수행하여 게시물 사진을 제외한 프로필 사진, 소개글, 게시글이 동일 마약 판매 계정을 추적하는 데에 유효한 정보임을 확인하였다.

사용자 선호도 변화에 따른 추천시스템의 다양성 적용 (Application of diversity of recommender system accordingtouserpreferencechange)

  • 나혜연;남기환
    • 지능정보연구
    • /
    • 제26권4호
    • /
    • pp.67-86
    • /
    • 2020
  • 추천시스템은 시간이 흐를수록 사용자와 기업에게 점점 더 큰 영향을 주고 있다. 최근 코로나(COVID-19) 팬데믹 현상이 전 세계적으로 일어나면서 세대를 뛰어넘어 E-Commerce의 중요성이 증대되었고 추천시스템은 E-Commerce 활성화의 최중심에 있다. 추천시스템이 개발된 이래로 다수의 알고리즘이 추천시스템의 정확도를 올리는 것에 집중되어 있었고, 추천시스템의 희귀성, 다양성, 우연성 등과 같은 다른 가치들이 간과되고 있다. 본 논문에서는 사용자의 만족도는 추천시스템의 정확도에만 달려있지 않고 다양한 성능을 겸비했을 때 고객에게 만족스러운 추천서비스 경험을 제공할 것이라 생각하여 다양성을 위한 그래프 기반의 추천시스템을 개발하였다. 사용자 네트워크를 구성한 뒤 카테고리를 활용한 무게중심변화를 통해 유사도가 낮은 이질적인 사용자를 찾아 추천상품의 유사성을 낮추는 방식으로 다양성을 도모하였다. 또한, 추천의 다양성은 사용자의 다양성 선호 수준에 따라 상이할 것이라는 가정에 따라 사용자의 다양성 선호 수준을 구별하였고 다양성 모델 성능이 사용자 특성별로 다름을 확인할 수 있었다. 전체 연구 결과, 추천시스템의 정확성과 다양성이 트레이드 오프 관계에 놓여있다는 것을 확인할 수 있었지만 본 연구모델을 통해 근소한 정확도 손실 대비 높은 다양성을 얻을 수 있었다. 본 연구는 그래프 기반의 추천시스템을 통해 사용자의 만족도를 향상시키는 다양성을 실현하였다는 연구적 의의와 사용자 수준을 고려한 추천의 다양성을 적용 결과를 통해 기업의 장기적 이윤을 상승시킬 수 있는 모델 개발이라는 실무적 의의를 꼽을 수 있다.

Word2Vec을 활용한 제품군별 시장규모 추정 방법에 관한 연구 (A Study on Market Size Estimation Method by Product Group Using Word2Vec Algorithm)

  • 정예림;김지희;유형선
    • 지능정보연구
    • /
    • 제26권1호
    • /
    • pp.1-21
    • /
    • 2020
  • 인공지능 기술의 급속한 발전과 함께 빅데이터의 상당 부분을 차지하는 비정형 텍스트 데이터로부터 의미있는 정보를 추출하기 위한 다양한 연구들이 활발히 진행되고 있다. 비즈니스 인텔리전스 분야에서도 새로운 시장기회를 발굴하거나 기술사업화 주체의 합리적 의사결정을 돕기 위한 많은 연구들이 이뤄져 왔다. 본 연구에서는 기업의 성공적인 사업 추진을 위해 핵심적인 정보 중의 하나인 시장규모 정보를 도출함에 있어 기존에 제공되던 범위보다 세부적인 수준의 제품군별 시장규모 추정이 가능하고 자동화된 방법론을 제안하고자 한다. 이를 위해 신경망 기반의 시멘틱 단어 임베딩 모델인 Word2Vec 알고리즘을 적용하여 개별 기업의 생산제품에 대한 텍스트 데이터를 벡터 공간으로 임베딩하고, 제품명 간 코사인 거리(유사도)를 계산함으로써 특정한 제품명과 유사한 제품들을 추출한 뒤, 이들의 매출액 정보를 연산하여 자동으로 해당 제품군의 시장규모를 산출하는 알고리즘을 구현하였다. 실험 데이터로서 통계청의 경제총조사 마이크로데이터(약 34만 5천 건)를 이용하여 제품명 텍스트 데이터를 벡터화 하고, 한국표준산업분류 해설서의 산업분류 색인어를 기준으로 활용하여 코사인 거리 기반으로 유사한 제품명을 추출하였다. 이후 개별 기업의 제품 데이터에 연결된 매출액 정보를 기초로 추출된 제품들의 매출액을 합산함으로써 11,654개의 상세한 제품군별 시장규모를 추정하였다. 성능 검증을 위해 실제 집계된 통계청의 품목별 시장규모 수치와 비교한 결과 피어슨 상관계수가 0.513 수준으로 나타났다. 본 연구에서 제시한 모형은 의미 기반 임베딩 모델의 정확성 향상 및 제품군 추출 방식의 개선이 필요하나, 표본조사 또는 다수의 가정을 기반으로 하는 전통적인 시장규모 추정 방법의 한계를 뛰어넘어 텍스트 마이닝 및 기계학습 기법을 최초로 적용하여 시장규모 추정 방식을 지능화하였다는 점, 시장규모 산출범위를 사용 목적에 따라 쉽고 빠르게 조절할 수 있다는 점, 이를 통해 다양한 분야에서 수요가 높은 세부적인 제품군별 시장정보 도출이 가능하여 실무적인 활용성이 높다는 점에서 의의가 있다.