바이오 컴퓨팅2 low-complexity regions(낮은 복잡도 영역) 과제 3-1 low-complexity regions란 낮은 복잡도 영역으로 일정한 패턴이 연속적으로 나오는 영역을 말한다. 문제: 주어진 FASTA 형식의 DNA 서열 파일에서 낮은 복잡도 영역의 시작 위치를 찾고, 해당 위치를 결과 파일에 저장하며, 코드 실행에 소요된 시간을 마이크로초 단위로 출력합니다. import sys import re import time # 문자열의 공백과 모든 개행문자(Whitespace)를 제거하고 대문자로 변환 def removeBlank(oneLine): return re.sub("\s+","",oneLine).upper() # ATGC 로 이루어진 문자열인지 확인 def checkDnaData(oneLine): if re.match("^(A|T|G|C)+$", oneLine):.. 2023. 3. 29. re (정규표현식) 과제1 문제: DNA 서열 데이터 파일을 읽어와서, DNA 서열 데이터인지 확인한 후, T를 U로 변환한 결과를 파일로 출력하는 파이썬 코드입니다. import sys import queue import re # 문자열의 공백과 모든 개행문자(Whitespace)를 제거하고 대문자로 변환 def removeBlank(oneLine): return re.sub("\s+","",oneLine).upper() # ATGC 로 이루어진 문자열인지 확인 def checkDnaData(oneLine): if re.match("^(A|T|G|C)+$", oneLine): return else: print(oneLine +" 이 DNA데이터가 아닙니다.") exit() # U를 T로 변환 def conversion(oneLi.. 2023. 3. 29. 이전 1 다음