Clustered Index & Non-Clustered Index 

 

테이블을 생성 후 Primary Key를 생성하면 기본적으로 Clutered Index로 지정이 됩니다.(클러스터형 인덱스가 없는 경우)

하지만, 데이터를 파악하고 인덱스를 걸면 가장 효율적인 컬럼을 클러스터 인덱스로 지정하는것을 권장합니다.

 

Clustered Index

  • 해당 컬럼을 기준으로 정렬, 테이블당 1개씩만 허용
  • Clustered Index가 적용된 컬롬은 CUD 작업이 진행될 경우 데이터의 정렬에 관여합니다. 
  • 되도록이면 UNIQUE 해야합니다.  UNIQUE하지 않으면 안되는것이 아니라 UNIQUE하지 않는 경우 오버헤드가 발생하는 것을 인지해야합니다.
  • SP_COLUMNS 명령을 이용해서 사용빈도(높음), 데이터길이(짧음), UNIQUE여부(되도록이면) 인 컬럼을 지정합니다.
  • 목차를 보고 해당 페이지를 찾아 가는것이 아니라 바로 해당 페이지를 찾아가는 것입니다.

 

Non-Clustered Index

  • 한 테이블에 여러개를 생성 할 수 있습니다. (최대 240개)
  • 목차를 보고 해당 페이지를 찾아가는 형태의 검색 방식입니다
  • 테이블에 대한 인덱스를 많이 만들면 테이블의 데이터가 변경될 경우 인덱스도 모두 적절하게 조정되어야 하므로 INSERT, UPDATE, DELETE  MERGE 문의 성능이 저하될 수 있습니다.
  • 쿼리의 조건자 및 조인 조건에서 자주 사용되는 열에 대해 비클러스터형 인덱스를 만듭니다. 

어떤 데이터 베이스를 스크립트로 스키마 및 데이터를 포함하여 백업받은 적이 있었습니다.

무려 용량이 60기가정도...


Microsoft SQL Sever Management Studio는 이파일을 읽지 못하고 Out of Memory를 뱉어 냅니다. ㅠㅠ


테스크를 아무리 찾아봐도 스크립트를 통한 Import 기능이 없습니다. (제가 못찾는 것 일 수도..)


파일을 분할하여 야금야금 데이터를 넣는데 30메가 단위로 작업이 되니 60기가를 처리하기에는 시간이 너무 오래 걸려서 다른 방법을 찾아 보았습니다.


SQL Server에도 Comment 명령 기능을 제공하고 있더군요 


바로


sqlcmd 라는 오라클의 sqlplus같은 기능을 하는 녀석입니다. 


기본적인 내용은..



구문

sqlcmd   
   -a packet_size  
   -A (dedicated administrator connection)  
   -b (terminate batch job if there is an error)  
   -c batch_terminator  
   -C (trust the server certificate)  
   -d db_name  
   -e (echo input)  
   -E (use trusted connection)  
   -f codepage | i:codepage[,o:codepage] | o:codepage[,i:codepage] 
   -g (enable column encryption) 
   -G (use Azure Active Directory for authentication)
   -h rows_per_header  
   -H workstation_name  
   -i input_file  
   -I (enable quoted identifiers)  
   -j (Print raw error messages)
   -k[1 | 2] (remove or replace control characters)  
   -K application_intent  
   -l login_timeout  
   -L[c] (list servers, optional clean output)  
   -m error_level  
   -M multisubnet_failover  
   -N (encrypt connection)  
   -o output_file  
   -p[1] (print statistics, optional colon format)  
   -P password  
   -q "cmdline query"  
   -Q "cmdline query" (and exit)  
   -r[0 | 1] (msgs to stderr)  
   -R (use client regional settings)  
   -s col_separator  
   -S [protocol:]server[instance_name][,port]  
   -t query_timeout  
   -u (unicode output file)  
   -U login_id  
   -v var = "value"  
   -V error_severity_level  
   -w column_width  
   -W (remove trailing spaces)  
   -x (disable variable substitution)  
   -X[1] (disable commands, startup script, environment variables, optional exit)  
   -y variable_length_type_display_width  
   -Y fixed_length_type_display_width  
   -z new_password   
   -Z new_password (and exit)  
   -? (usage)  

명령줄 옵션

로그인 관련 옵션
-A
SQL server 관리자 전용된 연결 (DAC)로 로그입니다. 이 연결 유형은 서버 문제를 해결하는 데 사용됩니다. 이 연결은 DAC를 지원하는 서버 컴퓨터에만 사용할 수 있습니다. DAC를 사용할 수 없는 경우 sqlcmd 는 오류 메시지를 생성하고 종료됩니다. DAC에 대한 자세한 내용은 데이터베이스 관리자를 위한 진단 연결을 참조하세요. -A 옵션-G 옵션과 함께 지원 되지 않습니다. -A를 사용 하 여 SQL 데이터베이스에 연결할 때 SQL server 관리자 여야 합니다. DAC는 Azure Active Directory 관리자에 대 한 사용할 수 없습니다.

-C
이 스위치는 클라이언트에서 유효성 검사 없이 암시적으로 서버 인증서를 신뢰하는 데 사용됩니다. 이 옵션은 ADO.NET 옵션 TRUSTSERVERCERTIFICATE = true와 동일합니다.

-d db_name
sqlcmd를 시작할 때 USE db_name 문을 실행합니다. 이 옵션은 sqlcmd 스크립팅 변수 SQLCMDDBNAME을 설정합니다.이 변수는 초기 데이터베이스를 지정합니다. 기본값은 사용자 로그인의 기본 데이터베이스 속성입니다. 데이터베이스가 없을 경우 오류 메시지가 생성되고 sqlcmd 가 종료됩니다.

-l login_timeout
서버에 연결을 시도할 때 ODBC 드라이버에 대한 sqlcmd 로그인 시간 제한(초)을 지정합니다. 이 옵션은 sqlcmd 스크립팅 변수 SQLCMDLOGINTIMEOUT을 설정합니다. 기본 sqlcmd 로그인 제한 시간은 8초입니다. -G 옵션을 사용하여 SQL 데이터베이스 또는 SQL 데이터 웨어하우스에 연결하고 Azure Active Directory를 사용하여 인증하는 경우 최소 30초의 시간 제한 값이 권장됩니다. 로그인 제한 시간은 0에서 65534 사이의 숫자여야 합니다. 입력한 값이 숫자가 아니거나 이 범위에 속하지 않을 경우 sqlcmd 는 오류 메시지를 생성합니다. 값을 0으로 설정하면 제한 시간이 없습니다.

-E
SQL Server에 로그온 할 때 사용자 이름 및 암호를 사용 하는 대신 트러스트 된 연결을 사용 합니다. -E 를 지정하지 않으면 sqlcmd 는 기본적으로 트러스트된 연결 옵션을 사용합니다.

-E 옵션은 SQLCMDPASSWORD 등의 가능한 사용자 이름 및 암호 환경 변수 설정을 무시합니다. -E 옵션과 함께 -U 옵션 또는 -P 옵션을 사용하면 오류 메시지가 생성됩니다.

-g
열 암호화 설정을 Enabled로 설정합니다. 자세한 내용은 Always Encrypted를 참조하세요. Windows 인증서 저장소에 저장된 마스터 키만 지원됩니다. -g 스위치를 사용하려면 적어도 sqlcmd 버전 13.1이 필요합니다. 사용 중인 버전을 확인하려면 sqlcmd -?를 실행하세요.

-G
이 스위치는 Azure Active Directory 인증을 사용하여 사용자를 인증하도록 지정하기 위해 SQL 데이터 웨어하우스 또는 SQL 데이터베이스에 연결할 때 클라이언트에서 사용됩니다. 이 옵션은 sqlcmd 스크립팅 변수 SQLCMDUSEAAD = true를 설정합니다. -G 스위치를 사용하려면 적어도 sqlcmd 버전 13.1이 필요합니다. 사용 중인 버전을 확인하려면 sqlcmd -?를 실행하세요. 자세한 내용은 Azure Active Directory 인증을 사용하여 SQL Database 및 SQL Data Warehouse에 연결을 참조하세요. -A 옵션-G 옵션과 함께 지원 되지 않습니다.


위의 옵션중 -i 옵션을 이용하여 대용량의 데이터를 쉽고 귀찮지 않게 넣을수 있었습니다. 




먼저 해당 데이터베이스가 설치된 PC에서 작업을 기준으로 설명하겠습니다. 


sqlcmd -i <파일경로 + 파일명>




저렇게 한참을 기다린뒤 작업이 마무리가 되어 명령프롬프트가 되돌아 왔습니다. 


실제 데이터도 한글이나 기타 문자도 깨짐이 없이 잘 들어 갔습니다. 



원격으로 작업을 진행하셔야하는 분들은 위의 명령어에 로그인옵션을 추가하여 작업할 수 있습니다. 



sqlcmd -S tcp:<ip address,port> -i <파일경로>




+ Recent posts