• 제목/요약/키워드: DEEP

검색결과 15,729건 처리시간 0.041초

분류 알고리즘 기반 주문 불균형 정보의 단기 주가 예측 성과 (Classification Algorithm-based Prediction Performance of Order Imbalance Information on Short-Term Stock Price)

  • 김선웅
    • 지능정보연구
    • /
    • 제28권4호
    • /
    • pp.157-177
    • /
    • 2022
  • 투자자들은 증권회사가 제공하는 시세표인 Limit Order Book 정보를 통해 국내외 투자자들이 제출하는 주문 정보를 실시간으로 파악하면서 거래에 참여하고 있다. Limit Order Book에 실시간으로 공개되고 있는 주문 정보가 주가 예측에서 유용성이 있을까? 본 연구는 장 중 투자자들의 매수와 매도 주문이 어느 한쪽으로 쏠리면서 주문 불균형이 나타나는 경우 미래 주가 등락의 예측 변수로서 유의성이 있는지를 분석하는 것이다. 분류 알고리즘을 이용하여 주문 불균형 정보의 당일 종가 등락에 대한 예측 정확도를 높이고, 예측 결과를 이용한 데이트레이딩 전략을 제안하며 실증분석을 통해 투자 성과를 분석한다. 자료는 2004년 1월 19일부터 2022년 6월 30일까지의 4,564일 동안의 코스피200 주가지수선물 5 분 봉 주가를 분석하였다. 실증분석 결과는 다음과 같다. 첫째, 총매수 주문량과 총매도 주문량의 불균형 정도로 측정하는 주문 불균형지수와 주가는 유의적 상관성을 보인다. 둘째, 주문 불균형 정보는 당일 종가까지의 미래 주가 등락에 대해서도 유의적인 영향력이 나타났다. 셋째, 주문 불균형 정보를 이용한 당일 종가 등락의 예측 정확도는 Support Vector Machines 알고리즘이 54.1%로 가장 높게 나타났다. 넷째, 하루 중 이른 시점에서 측정한 주문 불균형지수가 늦은 시점에서 측정한 주문 불균형지수보다 예측 정확성이 더 높았다. 다섯째, 종가 등락 예측 결과를 이용한 데이트레이딩 전략의 투자 성과는 비교모형의 투자 성과보다 높게 나타났다. 여섯째, 분류 알고리즘을 이용한 투자 성과는 K-Nearest Neighbor 알고리즘을 제외하면 모두 비교모형보다 총수익 평균이 높게 나타났다. 일곱째, Logistic Regression, Random Forest, Support Vector Machines, XGBoost 알고리즘의 예측 결과를 이용한 데이트레이딩 전략의 투자 성과는 수익성과 위험성을 동시에 평가하는 샤프비율에서도 비교모형보다 높은 결과를 보여주었다. 본 연구는 Limit Order Book 정보 중 총매수 주문량과 총매도 주문량 정보의 경제적 가치가 존재함을 밝혔다는 점에서 기존의 연구와 학술적 차별점을 갖는다. 본 연구의 실증분석 결과는 시장 참여자들에게 투자 전략적 측면에서 함의가 있다고 판단된다. 향후 연구에서는 최근 활발히 연구가 진행되고 있는 딥러닝 모형 등으로의 확장을 통해 주가 예측의 정확도를 높임으로써 데이트레이딩 투자전략의 성과를 개선할 필요가 있다.

도메인 특수성이 도메인 특화 사전학습 언어모델의 성능에 미치는 영향 (The Effect of Domain Specificity on the Performance of Domain-Specific Pre-Trained Language Models)

  • 한민아;김윤하;김남규
    • 지능정보연구
    • /
    • 제28권4호
    • /
    • pp.251-273
    • /
    • 2022
  • 최근 텍스트 분석을 딥러닝에 적용한 연구가 꾸준히 이어지고 있으며, 특히 대용량의 데이터 셋을 학습한 사전학습 언어모델을 통해 단어의 의미를 파악하여 요약, 감정 분류 등의 태스크를 수행하려는 연구가 활발히 이루어지고 있다. 하지만 기존 사전학습 언어모델이 특정 도메인을 잘 이해하지 못한다는 한계를 나타냄에 따라, 최근 특정 도메인에 특화된 언어모델을 만들고자 하는 방향으로 연구의 흐름이 옮겨가고 있는 추세이다. 도메인 특화 추가 사전학습 언어모델은 특정 도메인의 지식을 모델이 더 잘 이해할 수 있게 하여, 해당 분야의 다양한 태스크에서 성능 향상을 가져왔다. 하지만 도메인 특화 추가 사전학습은 해당 도메인의 말뭉치 데이터를 확보하기 위해 많은 비용이 소요될 뿐 아니라, 고성능 컴퓨팅 자원과 개발 인력 등의 측면에서도 많은 비용과 시간이 투입되어야 한다는 부담이 있다. 아울러 일부 도메인에서 추가 사전학습 후의 성능 개선이 미미하다는 사례가 보고됨에 따라, 성능 개선 여부가 확실하지 않은 상태에서 도메인 특화 추가 사전학습 모델의 개발에 막대한 비용을 투입해야 하는지 여부에 대해 판단이 어려운 상황이다. 이러한 상황에도 불구하고 최근 각 도메인의 성능 개선 자체에 초점을 둔 추가 사전학습 연구는 다양한 분야에서 수행되고 있지만, 추가 사전학습을 통한 성능 개선에 영향을 미치는 도메인의 특성을 규명하기 위한 연구는 거의 이루어지지 않고 있다. 본 논문에서는 이러한 한계를 극복하기 위해, 실제로 추가 사전학습을 수행하기 전에 추가 사전학습을 통한 해당 도메인의 성능 개선 정도를 선제적으로 확인할 수 있는 방안을 제시한다. 구체적으로 3개의 도메인을 분석 대상 도메인으로 선정한 후, 각 도메인에서의 추가 사전학습을 통한 분류 정확도 상승 폭을 측정한다. 또한 각 도메인에서 사용된 주요 단어들의 정규화된 빈도를 기반으로 해당 도메인의 특수성을 측정하는 지표를 새롭게 개발하여 제시한다. 사전학습 언어모델과 3개 도메인의 도메인 특화 사전학습 언어모델을 사용한 분류 태스크 실험을 통해, 도메인 특수성 지표가 높을수록 추가 사전학습을 통한 성능 개선 폭이 높음을 확인하였다.

동시베리아해 비구형 망가니즈단괴의 특성 (Characteristics of Non-Spherical Manganese Nodule from the East Siberian Sea)

  • 구효진;박무성;서충만;조현구
    • 광물과 암석
    • /
    • 제34권4호
    • /
    • pp.241-253
    • /
    • 2021
  • 유라시아 대륙 주변부 북극해의 천해에서도 태평양이나 인도양의 심해저에서와 같이 많은 망가니즈단괴가 발견되고 있지만, 이에 관한 자세한 연구는 많이 수행되고 있지 않다. 아라온호의 북극해 탐사를 통하여 동시베리아해에서 채취한 망가니즈단괴는 Mn/Fe 비가 매우 높아 Mn 자원으로서의 가능성이 매우 크다. 이번 연구에서는 북극 동시베리아해에서 산출되는 망가니즈단괴 중 약 7%를 차지하는 비구형 단괴를 외부형태에 따라 구분하고, 크기와 무게, 내부조직을 관찰하였으며, X선회절분석 그래프의 피크 면적비를 이용한 산화망가니즈광물의 반정량 분석과 지화학분석을 실시하여, 그 결과를 구형 단괴와 비교하였다. 비구형 망가니즈단괴는 외부형태에 따라 5가지로 구분되며, 타원체형, 판상형과 불규칙형이 대부분을 차지하며, 장경과 무게는 비례하는 경향이 있다. 비구형 단괴는 모두 핵을 가지며, 핵 성분은 이질 퇴적물이 주를 이룬다. 산화망 가니즈광물의 평균 함량은 버네사이트, 부서라이트, 토도로카이트 순으로 감소하며, 함량비는 외부형태, 내부조직이나 핵 성분과는 상관관계가 없지만, 단괴의 내부에서 외부로 갈수록 토도로카이트와 부서라이트는 감소하고, 버네사이트가 증가하는 경향이 있다. 북극해의 다른 천해는 물론 태평양이나 인도양의 심해저의 단괴에 비하여 Mn 함량이 많고, Mn/Fe 비가 높다. 비구형 단괴는 구형 단괴에 비하여 크기가 크고 무겁고, Mn 함량이 적고 Mn/Fe 비는 낮지만, 광물조성이나 내부조직에서는 큰 차이가 없다. 동시베리아해에서 채취된 모든 망간단괴는 Mn/Fe 비가 5 이상으로 높으므로 대부분 속성작용에 의하여 형성된 것으로 여겨진다.

한국, 미국, 중국, 일본의 초등학교 과학 교육과정과 교과서에 제시된 빛 관련 개념에 관한 비교 연구 (A Comparative Study on the Concept of Light Presented in Elementary School Science Curriculum and Textbooks in Korea, the US, China, and Japan)

  • 이지원;김중복
    • 한국초등과학교육학회지:초등과학교육
    • /
    • 제41권2호
    • /
    • pp.283-294
    • /
    • 2022
  • 초등학교 과학 교육과정에서 빛 개념은 중요하게 다루어지나 학생과 교사가 이해에 어려움을 갖는다는 보고가 많다. 내용 자체의 난이도 때문인지, 제시방법, 구성, 표현 등이 어려움을 유발하는 것인지 분석할 필요가 있다. 2015 초등 과학과 교육과정과 미국, 중국, 일본의 초등 교육과정과 교과서에서 나타난 빛 관련 주요개념, 빛 단원 내용구성, 사용한 소재와 광원, 광학기구를 비교하였다. 분석 결과, 네 나라의 교육과정에서 빛에 대한 주요개념의 포함 여부와 다루는 시점은 나라마다 차이가 있었다. 특히 우리나라 교육과정은 광원, 시각 개념을 도입하지 않은데 비해 볼록 렌즈에 의한 굴절 개념은 다룬다는 점에서 차이가 나타났다. 내용구성과 흐름에서도 나라별로 차이가 있었다. 한국 교육과정은 핵심 아이디어나 관점을 따라 내용이 구성되기보다 개념별로 분절적으로 제시되어 있고 개념 간 연계성이 불분명하였다. 주요개념을 설명하기 위한 소재와 광원, 광학기구에서도 국가별 차이점이 나타났는데, 빛의 이용이라는 주제에 대해 미국 교육과정은 목적을 제공하고 빛을 이용하여 이를 달성하는 방식, 중국과 한국은 개념이해를 심화하기 위한 소재를 사용하는 방식으로 나뉘었다. 이러한 분석 결과를 바탕으로 한 우리나라의 초등학교 과학 교육과정 빛 영역에 관한 시사점은 다음과 같이 도출하였다. 첫째, 개념을 순차적이고 단계적으로 도입하고, 개념 간 연계성이 잘 드러나도록 구성할 필요가 있다. 둘째, 광원에 관한 내용을 주요개념으로 포함하고, 개념 설명을 위해 사용하는 광원을 다루는 개념의 종류와 수준을 고려하여 선정할 필요가 있다. 셋째, 물체를 보는 원리를 포함할 필요가 있다. 넷째, 빛과 렌즈 단원에 포함된 굴절 개념의 소재와 내용 수준을 조정할 필요가 있다. 다섯째, 빛은 초등학교 과학 교육과정에서 포함하고 있는 여러 개념과 깊은 관련성을 가지기 때문에 통합적 접근이 필요하다.

건답직파에서 토양경도가 벼와 피의 출아에 미치는 영향 (Effect of Soil Strength on Seedling Emergence of Rice and Barnyardgrasses in Direct Dry-Seeding)

  • 권용웅;이변우;김도순
    • 한국작물학회지
    • /
    • 제41권4호
    • /
    • pp.489-495
    • /
    • 1996
  • 동진벼, 다다조, 이탈리코나베르네코, 갈색까락샤레벼 등 4품종과 강피, 돌피, 물피 등 3종의 피를 공시하여 토양 경도가 벼와 피의 출아 및 유아신장에 미치는 영향을 검토하였다. 토양 경도는 유압잭 (hydraulic jack)으로 토양 전체를 가압하여 토양경도계(산중식)로 0.5, 1, 2, 3, 6kg/$cm^2$가 되도록 처리하였으며, 온도는 실험기간 중 평균기온 17$^{\circ}C$(저온)와 $25^{\circ}C$ (적온) 두 처리를 두었다. 모든 처리에서 복토심은 3.5cm였으며, 파종후 토양 표면은 물에 적신 신문지로 피복하여 토막의 형성과 증발을 방지하였다. 1. 공시한 벼 품종 모두 온도 조건에 관계없이 토양 경도 2kg/$cm^2$까지는 토양경도의 증가에 따른 출아율의 감소는 크지 않았으나 그 이상으로 토양 경도가 증가함에 따라서 출아율이 직선적으로 감소하는 경향이었으며 출아율 감소 정도는 동진벼가 가장 컸다. 토양 경도 3kg /$cm^2$이상에서 출아율은 다다조>이탈리코나베르네코=갈색 까락샤레 벼>동진벼 의 순이었다. 2. 피의 경우도 벼와 마찬가지로 토양 경도2kg/$cm^2$까지는 출아율의 저하가 크지 않았으나 그 이상으로 토양 경도가 증가하는 경우 출아율이 현저하게 저하하였으며 출아율 저하는 강피>돌피>물피의 순으로 컸다. 또한 토양 경도 증가에 따른 피의 출아율 저하 정도는 벼에 비하여 현저히 컸다. 3. 평균출아일수는 공시 초종 및 온도 조건에 관계없이 토양 경도가 증가함에 따라서 직선적으로 증가하는 경향이었다. 토양 경도 증가에 따른 출아 지연 정도는 벼의 경우 동진벼가, 피의 경우는 강피가 가장 컸다. 4. 적온 조건에서 동진벼와 다다조는 토양 경도 2kg/$cm^2$까지 토양 경도가 증가함에 따라서 중배축장이 증가하는 경향이었으나 그 이상에서는 변화가 없었던 반면 갈색까락샤레벼와 이탈리코나베르네코는 6kg /$cm^2$까지 토양 경도 증가에 따라서 중배축장이 직선적으로 증대하였다. 저온 조건에서는 공시한 벼 품종 모두 토양 경도 3kg/$cm^2$에서 중배축장이 최대에 달하였으며 그 이상에서는 변화가 없거나 다소 감소하는 경향이었다. 토양 경도가 3kg/$cm^2$이상인 조건에서 장려품종인 동진벼의 출아율이 가장 낮았으며 그 원인은 중배축의 신장이 잘 안되어 본엽이 지중에서 전개되기 때문인것으로 판단되었다.

  • PDF

주요 고농서를 통한 조성시대의 도작기술 발전 과정 영구 IV. 조선시대의 비곡종 및 경지관리 (Transition of Rice Culture Practices during Chosun Dynasty through Old References IV. Preparation of Seeds and Land)

  • 이숭겸;구자옥;이은웅;이홍석
    • 한국작물학회지
    • /
    • 제36권6호
    • /
    • pp.576-585
    • /
    • 1991
  • 비곡종법은 중국의 $\ulcorner$범승지서$\lrcorner$부터 이미 확립 된 체계가 있어서 우리나라도 대부분 이를 인용하여 따르는 경향이 있었으며, 취종법은 비정상형의 종자를 선별해 버리고 우량종자를 선택하는 방식이었고, 선종법도 중국은 수선법을 따랐으나 우리나라는 풍선$\longrightarrow$절별$\longrightarrow$수선법을 창안발전시켰고, 최근에는 염수선이 첨가되었을 뿐, 모두가 완벽한 기술이었다. 종자흡습도 측정법이나 종자의 설즙 및 요분, 골즙처리법 등은 그 근간이 고대중국에서 유래된 것으로 우리나라의 농서들도 대체로 이를 인용하거나 다소의 가감을 통하여 수용하고 있었으나 이들 기술이 갖는 타당성은 합리성에 비하여 번거롭고 비현실적이며, 이는 우리나라 입지보다 중국의 한지, Alkali토양에서 오히려 수긍도가 높은 기술로 해석된다. 경지는 농사의 시작을 알리는 작업으로서 천지간에 기통하는 때를 기다려 시행한다는 고래 중국의 농업관을 거의 가감없이 선초부터 선말의 농서에까지 인용하고 있었다. 초경, 추경(혹은 춘경), 기경은 깊게하고 재경, 춘경(흑은 하경), 중경은 얕게 하며, 전자는 저수와 정지를 목적으로 하고 후자는 중경제초를 목적으로 하도록 기술분화 하고 있었다. 그러나 한전의 세역법에서 와 달리 상경하는 우리나라에서는 추경이 권장되고 있었으나 실제로 추경하지는 못하고 있었으며 이런 상황으로부터 시대를 경과하며 우리나라의 기경법은 녹비작물이용법, 엄경법, 분양법, 때에 따라서 건경법 등과 연계시켜 수행토록 종합처리법으로 발전을 이룩하였다. 뿐만 아니라 15세기까지는 새로운 산전과 연안지로의 경지확장을 위한 개간법을 지원하기 위한 농기구로서 윤목사용법이 창안되었고 17-18세기부터는 내외환으로 황무지화한 농경지를 대상으로 우선적으로 노동생산성을 제고시킴으로써 생산력까지 회복시키고자 하였으며, 이를 위하여 중국고대농법인 반종법과 소누법을 재인용 소개하여 왔으나 큰 성과는 불분명하며 드디어 선말에는 이에 대한 현실성을 평가하기에 이르렀다.

  • PDF

종 다양성 평가를 위한 호소 생태계 동물플랑크톤 조사 방법 연구: 희박화 분석(rarefaction analysis)을 이용한 적정 시료 농축 정도 및 부차 시료 추출량의 검증 (Validation of Suitable Zooplankton Enumeration Method for Species Diversity Study Using Rarefaction Curve and Extrapolation)

  • 오혜지;최예림;김현준;홍근혁;박영석;김용재;장광현
    • 생태와환경
    • /
    • 제55권4호
    • /
    • pp.274-284
    • /
    • 2022
  • 본 연구에서는 수생태계 생물다양성을 평가할 때보다 정확한 동물플랑크톤 종 다양성을 산정하고 수체 간 상대 비교 시 오차를 줄이기 위한 방안으로서, 관찰 노력, 즉 시료의 농축 정도 및 부차시료 추출량의 적정안을 제시하기 위해 수심, 영양상태 및 동물플랑크톤 군집 출현 양상이 서로 다른 세 개 호소를 대상으로 표준 크기 기반 희박화 분석(sample-size-based rarefaction analysis)을 수행하였다. 현장에서 동일한 채집 도구를 이용, 조사 정점의 수심을 고려하여 채집된 동물플랑크톤 시료로부터 부차시료 추출량을 달리함에 따라 추정되는 생물다양성 (richness, Shannon's H')은 호소에 따라 변화 양상이 다르게 나타났으나, 세 호소 모두 최대 시료 분석량에서 다양성 지수 값이 가장 높게 추정되었다. Sample coverage에 대한 희박화 분석 결과, 채집 시료 내 동물플랑크톤 출현 종수 및 개 체 밀도가 모두 많은 주암호의 경우 농축 시료 100 mL 기준 1 mL의 부차시료만 검경해도 해당 표본이 전체 시료의 99.8%를 대표하는 것으로 나타났으나, 매우 적은 출현 종수 및 개체 밀도를 보인 소양호에서는 동량의 농축 시료로부터 10 mL의 부차시료를 추출했을 때도 97%로 비교적 낮은 대표성을 보였다. 이와 같이 동물플랑크톤 전체 채집 시료에 대한 부차시료의 대표성은 현장으로부터 채집된 시료 내 개체 밀도에 따라 다르게 나타나며, 채집 개체 밀도에 따라 시료의 농축 정도 및 부차시료 추출량을 조절한다면 최소의 관찰 노력으로 지점 간 출현 종수 및 다양성 지수 비교 시 발생하는 오차를 최소화할 수 있을 것으로 사료된다. 또한, 본 연구 결과는 호소 동물플랑크톤 군집 분석 및 수체 간 상대 비교를 위한 동물플랑크톤 시료 검경 방법에 있어 시료 여과량, 농축 및 부차시료 추출 방법을 표준화하는데 기준이 될 수 있는 정보를 제공한다.

HSPF를 이용한 농업비점오염원 최적관리방안에 따른 수질개선효과 예측 (Predicting the Effects of Agriculture Non-point Sources Best Management Practices (BMPs) on the Stream Water Quality using HSPF)

  • 이경석;이동훈;안영미;강주현
    • 한국습지학회지
    • /
    • 제25권2호
    • /
    • pp.99-110
    • /
    • 2023
  • 농업지역에서 발생하는 비점오염물질은 타 지역에 비해 넓은 면적에서 배출되기 때문에 수질관리를 위해서는 발생원 제어와 배출수 관리와 같은 다양한 오염원 저감대책이 필요하며, 이를 위해서는 유역특성을 고려한 오염원별 배출량 및 최적관리방안에 따른 수질개선 효과를 정량적으로 파악할 필요가 있다. 이에 본 연구는 Hydrological Simulation Program-FORTRAN(HSPF)모델을 활용하여 유역내 오염원별 부하 및 주요 오염원저감방안에 대한 수질개선효과를 분석하여 농업지역의 비점오염관리대책 수립 지원을 목적으로 하였다. 연구지역은 경남 창녕군 계성천 유역으로 전체 면적대비 농업지역이 약 26.13%로 산림을 제외하고 지배적인 토지이용을 가지며, 주요 오염원은 농업활동에 기인하는 화학비료 및 액비살포와 축사에서 발생하여 야적 또는 농지에 살포되는 축분을 포함하고 있다. 계성천 유역에 대한 HSPF 모델 구축시 화학비료와 액비 사용량, 소규모 축사의 축분 발생량과 공공하수처리장, 분뇨처리장, 마을하수도 및 개인오수처리시설 등 점오염원 영향을 고려하였다. 특히 본 연구에서는 영양염류의 식생흡수, 침적, 흡탈착, 깊은침투에 의한 손실 등 상세 순환기작모의가 가능하도록 NITR 및 PHOS모듈을 활용하였다. 구축된 모델은 유역말단의 2015~2020년 측정값을 토대로 보·검정을 수행하였으며 모델이 유량 및 수질을 적절히 모의하는 것을 확인하였다. 오염저감시나리오는 농업비점관리(배수물꼬관리, 완효성비료와 사용), 축산비점관리(액비저감, 소규모 축사 축분관리), 생활계오염원제어(개인오수처리시설 관리) 등 세 부문으로 구분하고, 달성기간에 따라 단기, 중기, 및 장기로 구분하여 부문별로 단계별 저감대책을 구성하였다. 개별시나리오 모의 결과 수질개선에 효과는 완효성비료의 대체사용>배수물꼬관리>소규모축사 축분관리 순으로 나타났다. 유역 전반에 모든 관리방안을 적용하였을 때 장기적으로 TN, TP의 연간부하량은 각각 40.6%, 41.1%, 연평균 농도는 각각 35.1%, 29.2% 감소되는 효과를 보였다. 본 연구를 통하여 농업활동 우세 유역에서의 다양한 오염원 저감시나리오별 수질개선효과에 대한 예측 및 이에 기반한 오염관리대책 우선순위 도출을 위한 합리적인 방법론을 제시하고자 한다.

금당천에 서식하는 얼록동사리(Odontobutis interrupta)의 생태 특징 (Ecological Characteristics of Korean Dark Sleeper, Odontobutis interrupta in Geumdang Stream, Korea)

  • 변화근
    • 한국환경생태학회지
    • /
    • 제37권1호
    • /
    • pp.86-93
    • /
    • 2023
  • 얼록동사리(Odontobutis interrupta)의 생태적 특징을 연구하기 위해 2021년 1월부터 2021년 12월까지 금당천에서 조사를 실시하였다. 본 종의 서식지 하상구조는 모래(sand)와 진흙(mud)이 풍부하였다. 수심은 평균 48(21~124)cm로 다소 깊었으며, 유속이 0.24(0.08~0.36)m/sec로 느렸다. 암수 성비는 1 : 0.98 이었고, 채집된 개체의 전장 범위는 23mm에서 162mm 이었다. 전장빈도분포도에 따른 연령은 5월 기준 전장이 23~59mm는 만 1년생, 60~99mm는 만 2년생, 100~139mm는 만 3년생, 140~162mm는 만 4년생 이상으로 추정되었다. 2차성징으로 생식적 유두(genital papilla)는 암컷의 경우 원통형 모양으로 끝의 안쪽이 비어 있으며 직경이 수컷에 비해 컷으며 수컷은 끝이 뾰족하여 원뿔 모양이었다. 성적성숙이 이루어진 수컷은 혼인색으로 복부와 몸통 전체가 검은색을 띄었다. 암컷의 경우 60~69mm에 해당하는 일부 개체만 성적성숙을 하였고 70mm 이상이면 모두 성적성숙을 하였다. 수컷은 70~79mm에 해당하는 개체 중 일부만 성적성숙을 하였고 80mm 이상에서 모두 성적성숙이 이루어졌다. 산란시기는 5월부터 시작되어 7월에 끝났으며(수온 19.6~29℃) 산란 성기는 6월로 추정되었다(수온 26℃). 포란수는 평균 2,473(883~4,955)개 이었고 성숙란은 짙은 노란색 구형으로 직경이 1.42(1.20~0.54)mm 이었다. 전장-체중과의 상관관계식은 BW=0.0000006TL3.21로 상수 a는 0.0000006를, 매개변수 b는 3.21 이었다. 비만도 지수는 평균 K=1.67(1.18~2.43) 이었고 기울기(Slope)는 0.116로 양의 값을 나타내었다.

GEase-K: 부가 정보를 활용한 선형 및 비선형 오토인코더 기반의 추천시스템 (GEase-K: Linear and Nonlinear Autoencoder-based Recommender System with Side Information)

  • 이태범;이승학;마민정;조윤호
    • 지능정보연구
    • /
    • 제29권3호
    • /
    • pp.167-183
    • /
    • 2023
  • 최근 추천시스템 분야에서는 희소한 데이터를 효과적으로 모델링하기 위한 다양한 연구가 진행되고 있다. GLocal-K(Global and Local Kernels for Recommender Systems)는 그중 하나의 연구로 전역 커널과 지역 커널을 결합하여 데이터의 전역적인 패턴과 개별 사용자의 특성을 모두 고려해 사용자 맞춤형 추천을 제공하는 모델이다. 하지만 GLocal-K는 커널 트릭을 사용하기 때문에 매우 희소한 데이터에서 성능이 떨어지고 부가 정보를 사용하지 않아 새로운 사용자나 아이템에 대한 추천을 제공하는 데 어려움이 있다. 본 논문에서는 이러한 GLocal-K의 단점을 극복하기 위해 EASE(Embarrassingly Shallow Autoencoders for Sparse Data) 모델과 부가 정보를 활용한 GEase-K(Global and EASE kernels for Recommender Systems) 모델을 제안한다. 우선 GLocal-K의 지역 커널 대신 EASE를 활용하여 매우 희소한 데이터에서 추천 성능을 높이고자 하였다. EASE는 단순한 선형 연산 구조로 이루어져 있지만, 규제화와 아이템 간 유사도 학습을 통해 매우 희소한 데이터에서 높은 성능을 내는 오토인코더이다. 다음으로 Cold Start 완화를 위해 부가 정보를 활용하였다. 학습 과정에서 부가 정보를 추가하기 위해 조건부 오토인코더 구조를 적용하였으며 이를 통해 사용자-아이템 간의 유사성을 더 잘 파악할 수 있도록 하였다. 결론적으로 GEase-K는 선형 구조와 비선형 구조의 결합, 부가 정보의 활용을 통해 매우 희소한 데이터와 Cold Start 상황에서 강건한 모습을 보인다. 실험 결과, GEase-K는 매우 희소한 GoodReads, ModCloth 데이터 세트에서 RMSE, MAE 평가 지표 기준 GLocal-K 보다 높은 성능을 보였다. 또한 GoodReads, ModCloth 데이터 세트를 4개의 집단으로 나누어 실험한 Cold Start 실험에서도 GLocal-K 대비 Cold Start 상황에서 좋은 성능을 보였다.