This page gives nucleotide usage information at each position around the donor and acceptor splice sites for the following data sets: 1. All introns 2. Introns by phase 2a. All phase 0 introns 2b. All phase 1 introns 2c. All phase 2 introns 3. Introns by gene G+C content 3a. Introns in genes with very low G+C content (G+C < 41.2%) 3b. Introns in genes with low, but not very low, G+C content (41.2% <= G+C < 48.9%) 3c. Introns in genes with high, but not very high, G+C content (48.9% <= G+C < 55.0%) 3d. Introns in genes with very high G+C content (55.0% <= G+C) 4. Introns by donor site classification 4a. Introns with adenosine at donor position +3 (the 'A3' group) 4b. Introns with guanosine at donor position +3 (the 'G3' group) 4c. Introns with cytosine or thymidine/uridine at donor position +3 (the 'Y3' group) 4d. Introns with weak donor sites (the 'weak' group) 4e. Introns with U12-type GT-AG splice sites (the 'U12' group) 4f. Introns with GC-AG splice sites (the 'GC' group) 5. Splice sites associated with cassette exons 5a. Splice sites for skipped exons 5b. Splice sites for introns covering skipped exons 5c. Splice sites for cryptic exons 5d. Splice sites for introns covering cryptic exons 6. Splice sites associated with intron/exon truncation and extension events 6a. Constitutive introns with alternative donor site isoforms 6b. Alternative introns demonstrating donor site isoforms 6c. Constitutive introns with small (up to 10 nts) alternative acceptor site isoforms 6d. Alternative introns demonstrating small (up to 10 nts) acceptor site isoforms 6e. Constitutive introns with large (greater than 10 nts) alternative acceptor site isoforms 6f. Alternative introns demonstrating large (greater than 10 nts) acceptor site isoforms 7. Splice sites associated with observed intron retention events 7a. Splice sites of exons that have retained introns 7b. Splice sites of introns that have been retained For more information on the meaning of these categories, please refer to the manuscript. The nucleotide usage information is presented as a table where the rows represent the nucleotides, and the columns represent the positions. For donor sites, the positions -5 to +10 are given, while for acceptor sites the positions -10 to +5 are given. The position of the splice sites is indicated. Note that redundancy has been removed from the distributions. That is, in cases where, for instance, a number of introns have the same donor site, but different acceptor sites, and where more than one of these introns belongs in one of the given clasifications, then only one of the introns will used in determining the donor site nucleotide distribution. 1. All introns ============== distribution matrix for donor splice sites there were 15412 sequences A: 0.286 0.281 0.322 0.627 0.092 | 0.000 0.000 0.543 0.686 0.077 0.168 0.265 0.205 0.201 0.203 C: 0.257 0.284 0.376 0.116 0.031 | 0.000 0.011 0.029 0.080 0.061 0.165 0.209 0.277 0.288 0.255 G: 0.212 0.235 0.190 0.118 0.810 | 1.000 0.000 0.400 0.128 0.797 0.213 0.329 0.258 0.258 0.282 T: 0.245 0.199 0.113 0.139 0.067 | 0.000 0.989 0.027 0.106 0.064 0.453 0.197 0.261 0.253 0.259 distribution matrix for acceptor splice sites there were 15443 sequences A: 0.082 0.086 0.098 0.100 0.079 0.081 0.226 0.050 1.000 0.000 | 0.238 0.237 0.242 0.235 0.257 C: 0.323 0.334 0.365 0.389 0.401 0.346 0.310 0.688 0.000 0.000 | 0.148 0.201 0.246 0.269 0.261 G: 0.114 0.118 0.113 0.094 0.068 0.070 0.221 0.007 0.000 1.000 | 0.507 0.206 0.256 0.240 0.213 T: 0.481 0.463 0.424 0.418 0.453 0.503 0.243 0.255 0.000 0.000 | 0.107 0.357 0.256 0.256 0.269 2. Introns by phase =================== 2a. All phase 0 introns ----------------------- distribution matrix for donor splice sites of phase 0 introns there were 7835 sequences A: 0.331 0.222 0.348 0.682 0.065 | 0.000 0.000 0.529 0.668 0.085 0.169 0.261 0.202 0.203 0.202 C: 0.228 0.325 0.358 0.100 0.026 | 0.000 0.015 0.033 0.086 0.064 0.174 0.210 0.274 0.285 0.254 G: 0.174 0.244 0.227 0.090 0.837 | 1.000 0.000 0.407 0.141 0.784 0.217 0.331 0.269 0.259 0.285 T: 0.268 0.209 0.067 0.128 0.072 | 0.000 0.985 0.031 0.106 0.067 0.440 0.197 0.255 0.254 0.259 distribution matrix for acceptor splice sites of phase 0 introns there were 7897 sequences A: 0.083 0.086 0.098 0.101 0.081 0.081 0.224 0.053 1.000 0.000 | 0.232 0.260 0.197 0.240 0.301 C: 0.318 0.334 0.369 0.390 0.389 0.335 0.311 0.682 0.000 0.000 | 0.131 0.182 0.269 0.252 0.232 G: 0.116 0.119 0.112 0.093 0.072 0.072 0.220 0.008 0.000 1.000 | 0.544 0.178 0.260 0.286 0.167 T: 0.483 0.461 0.421 0.416 0.459 0.511 0.245 0.257 0.000 0.000 | 0.093 0.380 0.273 0.222 0.301 2b. All phase 1 introns ----------------------- distribution matrix for donor splice sites of phase 1 introns there were 4681 sequences A: 0.201 0.329 0.347 0.532 0.082 | 0.000 0.000 0.559 0.716 0.069 0.174 0.269 0.208 0.199 0.206 C: 0.330 0.257 0.344 0.133 0.029 | 0.000 0.005 0.027 0.072 0.057 0.154 0.206 0.281 0.288 0.254 G: 0.234 0.268 0.127 0.151 0.838 | 1.000 0.000 0.391 0.111 0.814 0.214 0.332 0.252 0.265 0.285 T: 0.235 0.146 0.182 0.184 0.051 | 0.000 0.995 0.022 0.102 0.061 0.457 0.193 0.258 0.248 0.256 distribution matrix for acceptor splice sites of phase 1 introns there were 4874 sequences A: 0.079 0.084 0.096 0.104 0.078 0.082 0.229 0.046 1.000 0.000 | 0.283 0.198 0.262 0.274 0.183 C: 0.329 0.330 0.361 0.383 0.411 0.365 0.321 0.695 0.000 0.000 | 0.158 0.236 0.233 0.262 0.317 G: 0.107 0.118 0.116 0.092 0.064 0.064 0.218 0.004 0.000 1.000 | 0.445 0.235 0.306 0.171 0.247 T: 0.485 0.468 0.427 0.422 0.447 0.489 0.232 0.255 0.000 0.000 | 0.114 0.331 0.198 0.293 0.253 2c. All phase 2 introns ----------------------- distribution matrix for donor splice sites of phase 2 introns there were 2904 sequences A: 0.300 0.364 0.210 0.634 0.180 | 0.000 0.000 0.554 0.687 0.070 0.158 0.272 0.208 0.201 0.202 C: 0.218 0.220 0.474 0.134 0.050 | 0.000 0.008 0.024 0.077 0.061 0.157 0.212 0.278 0.294 0.260 G: 0.282 0.156 0.191 0.136 0.691 | 1.000 0.000 0.396 0.122 0.808 0.201 0.314 0.237 0.244 0.271 T: 0.199 0.260 0.125 0.095 0.078 | 0.000 0.992 0.025 0.114 0.061 0.484 0.201 0.278 0.262 0.266 distribution matrix for acceptor splice sites of phase 2 introns there were 2982 sequences A: 0.076 0.088 0.102 0.092 0.079 0.079 0.224 0.050 1.000 0.000 | 0.182 0.239 0.326 0.159 0.265 C: 0.328 0.333 0.363 0.391 0.411 0.342 0.295 0.692 0.000 0.000 | 0.173 0.193 0.204 0.325 0.248 G: 0.120 0.114 0.109 0.096 0.060 0.069 0.224 0.005 0.000 1.000 | 0.517 0.227 0.161 0.226 0.284 T: 0.476 0.465 0.426 0.422 0.450 0.509 0.257 0.252 0.000 0.000 | 0.127 0.340 0.309 0.290 0.203 3. Introns by gene G+C content ============================== 3a. Introns in genes with very low G+C content (G+C < 41.2%) ------------------------------------------------------------ distribution matrix for donor splice sites there were 3873 sequences A: 0.338 0.366 0.373 0.668 0.127 | 0.000 0.000 0.767 0.702 0.126 0.209 0.367 0.293 0.289 0.284 C: 0.200 0.214 0.319 0.097 0.023 | 0.000 0.010 0.018 0.055 0.049 0.109 0.137 0.170 0.189 0.177 G: 0.181 0.185 0.179 0.089 0.763 | 1.000 0.000 0.178 0.089 0.719 0.144 0.190 0.180 0.158 0.166 T: 0.280 0.235 0.129 0.146 0.086 | 0.000 0.990 0.037 0.154 0.106 0.539 0.306 0.356 0.364 0.373 distribution matrix for acceptor splice sites there were 3882 sequences A: 0.117 0.131 0.140 0.153 0.122 0.119 0.276 0.088 1.000 0.000 | 0.280 0.276 0.293 0.273 0.300 C: 0.189 0.211 0.234 0.234 0.210 0.185 0.197 0.494 0.000 0.000 | 0.134 0.153 0.173 0.222 0.214 G: 0.082 0.094 0.073 0.078 0.049 0.056 0.157 0.003 0.000 1.000 | 0.464 0.165 0.209 0.209 0.179 T: 0.611 0.564 0.553 0.534 0.619 0.640 0.371 0.415 0.000 0.000 | 0.122 0.405 0.325 0.297 0.308 3b. Introns in genes with low, but not very low, G+C content (41.2% <= G+C < 48.9%) ----------------------------------------------------------------------------------- distribution matrix for donor splice sites there were 3814 sequences A: 0.301 0.295 0.345 0.645 0.093 | 0.000 0.000 0.625 0.703 0.082 0.185 0.294 0.223 0.218 0.234 C: 0.252 0.269 0.355 0.095 0.029 | 0.000 0.011 0.025 0.064 0.063 0.146 0.190 0.260 0.265 0.233 G: 0.200 0.216 0.185 0.108 0.808 | 1.000 0.000 0.321 0.117 0.784 0.194 0.290 0.250 0.237 0.246 T: 0.248 0.219 0.115 0.152 0.071 | 0.000 0.989 0.029 0.117 0.071 0.475 0.226 0.267 0.279 0.287 distribution matrix for acceptor splice sites there were 3809 sequences A: 0.084 0.095 0.101 0.102 0.076 0.083 0.235 0.055 1.000 0.000 | 0.252 0.249 0.265 0.244 0.257 C: 0.261 0.295 0.329 0.331 0.316 0.282 0.285 0.631 0.000 0.000 | 0.137 0.188 0.227 0.245 0.244 G: 0.116 0.115 0.093 0.103 0.065 0.067 0.202 0.010 0.000 1.000 | 0.499 0.181 0.245 0.230 0.207 T: 0.539 0.495 0.476 0.465 0.543 0.568 0.278 0.305 0.000 0.000 | 0.112 0.382 0.262 0.281 0.292 3c. Introns in genes with high, but not very high, G+C content (48.9% <= G+C < 55.0%) ------------------------------------------------------------------------------------- distribution matrix for donor splice sites there were 3836 sequences A: 0.255 0.242 0.296 0.613 0.075 | 0.000 0.000 0.437 0.687 0.056 0.155 0.215 0.174 0.168 0.161 C: 0.277 0.307 0.400 0.126 0.033 | 0.000 0.012 0.036 0.094 0.070 0.187 0.249 0.301 0.320 0.291 G: 0.227 0.265 0.194 0.127 0.833 | 1.000 0.000 0.503 0.135 0.826 0.248 0.387 0.292 0.308 0.336 T: 0.241 0.185 0.110 0.135 0.060 | 0.000 0.988 0.023 0.085 0.048 0.409 0.149 0.234 0.204 0.212 distribution matrix for acceptor splice sites there were 3846 sequences A: 0.070 0.063 0.081 0.081 0.062 0.072 0.211 0.036 1.000 0.000 | 0.227 0.215 0.216 0.225 0.243 C: 0.383 0.388 0.429 0.456 0.489 0.414 0.366 0.774 0.000 0.000 | 0.158 0.220 0.282 0.303 0.291 G: 0.123 0.126 0.127 0.091 0.075 0.077 0.232 0.007 0.000 1.000 | 0.508 0.217 0.285 0.237 0.225 T: 0.424 0.423 0.363 0.372 0.374 0.436 0.190 0.183 0.000 0.000 | 0.107 0.347 0.217 0.235 0.240 3d. Introns in genes with very high G+C content (55.0% <= G+C) -------------------------------------------------------------- distribution matrix for donor splice sites there were 3889 sequences A: 0.250 0.221 0.274 0.583 0.073 | 0.000 0.000 0.343 0.653 0.045 0.125 0.186 0.131 0.131 0.134 C: 0.298 0.348 0.428 0.148 0.041 | 0.000 0.010 0.038 0.107 0.064 0.217 0.262 0.375 0.375 0.321 G: 0.242 0.273 0.201 0.146 0.835 | 1.000 0.000 0.598 0.172 0.859 0.267 0.446 0.308 0.328 0.381 T: 0.211 0.158 0.097 0.122 0.051 | 0.000 0.990 0.020 0.069 0.032 0.391 0.106 0.186 0.166 0.165 distribution matrix for acceptor splice sites there were 3906 sequences A: 0.056 0.055 0.070 0.063 0.056 0.052 0.183 0.023 1.000 0.000 | 0.196 0.206 0.194 0.199 0.228 C: 0.456 0.439 0.467 0.533 0.586 0.502 0.392 0.851 0.000 0.000 | 0.160 0.241 0.300 0.305 0.296 G: 0.136 0.136 0.158 0.102 0.081 0.079 0.292 0.006 0.000 1.000 | 0.559 0.258 0.284 0.283 0.240 T: 0.352 0.370 0.305 0.302 0.277 0.368 0.133 0.120 0.000 0.000 | 0.086 0.294 0.222 0.213 0.235 4. Introns by donor site classification ======================================= 4a. Introns with adenosine at donor position +3 (the 'A3' group) ---------------------------------------------------------------- distribution matrix for donor splice sites of 'A3' introns there were 8078 sequences A: 0.302 0.305 0.338 0.657 0.106 | 0.000 0.000 1.000 0.629 0.117 0.210 0.293 0.236 0.232 0.232 C: 0.246 0.264 0.364 0.096 0.026 | 0.000 0.000 0.000 0.095 0.083 0.145 0.192 0.252 0.260 0.238 G: 0.201 0.217 0.182 0.107 0.804 | 1.000 0.000 0.000 0.141 0.703 0.225 0.283 0.238 0.225 0.234 T: 0.251 0.214 0.116 0.141 0.063 | 0.000 1.000 0.000 0.135 0.097 0.419 0.232 0.274 0.284 0.296 distribution matrix for acceptor splice sites of 'A3' introns there were 8302 sequences A: 0.084 0.093 0.106 0.108 0.085 0.087 0.239 0.061 1.000 0.000 | 0.251 0.245 0.254 0.243 0.266 C: 0.286 0.296 0.333 0.347 0.346 0.298 0.287 0.636 0.000 0.000 | 0.146 0.185 0.230 0.259 0.252 G: 0.103 0.111 0.097 0.089 0.061 0.066 0.198 0.005 0.000 1.000 | 0.492 0.199 0.249 0.225 0.205 T: 0.526 0.500 0.464 0.456 0.508 0.549 0.277 0.299 0.000 0.000 | 0.111 0.371 0.266 0.273 0.277 4b. Introns with guanosine at donor position +3 (the 'G3' group) ---------------------------------------------------------------- distribution matrix for donor splice sites of 'G3' introns there were 6127 sequences A: 0.265 0.252 0.302 0.571 0.079 | 0.000 0.000 0.000 0.805 0.024 0.117 0.231 0.167 0.159 0.162 C: 0.269 0.306 0.386 0.150 0.040 | 0.000 0.000 0.000 0.053 0.025 0.190 0.237 0.314 0.324 0.277 G: 0.232 0.261 0.202 0.134 0.808 | 1.000 0.000 1.000 0.104 0.932 0.201 0.385 0.285 0.306 0.351 T: 0.234 0.181 0.109 0.145 0.074 | 0.000 1.000 0.000 0.038 0.019 0.491 0.147 0.235 0.211 0.210 distribution matrix for acceptor splice sites of 'G3' introns there were 6309 sequences A: 0.074 0.070 0.084 0.084 0.068 0.071 0.210 0.037 1.000 0.000 | 0.223 0.229 0.226 0.226 0.246 C: 0.375 0.386 0.408 0.444 0.475 0.411 0.347 0.759 0.000 0.000 | 0.152 0.216 0.267 0.287 0.275 G: 0.125 0.125 0.132 0.094 0.074 0.072 0.247 0.005 0.000 1.000 | 0.524 0.217 0.265 0.254 0.221 T: 0.426 0.419 0.376 0.377 0.384 0.446 0.196 0.199 0.000 0.000 | 0.102 0.339 0.242 0.233 0.258 4c. Introns with cytosine or thymidine/uridine at donor position +3 (the 'Y3' group) ------------------------------------------------------------------------------------ distribution matrix for donor sites there were 761 sequences A: 0.273 0.288 0.329 0.849 0.013 | 0.000 0.000 0.000 0.591 0.021 0.133 0.281 0.187 0.198 0.208 C: 0.265 0.317 0.449 0.039 0.003 | 0.000 0.000 0.537 0.042 0.020 0.109 0.181 0.260 0.315 0.261 G: 0.201 0.225 0.171 0.053 0.980 | 1.000 0.000 0.000 0.159 0.945 0.167 0.375 0.271 0.235 0.244 T: 0.260 0.171 0.051 0.059 0.004 | 0.000 1.000 0.463 0.208 0.014 0.591 0.163 0.283 0.251 0.286 distribution matrix for acceptor sites there were 789 sequences A: 0.087 0.095 0.094 0.112 0.093 0.077 0.230 0.043 1.000 0.000 | 0.232 0.234 0.213 0.266 0.243 C: 0.300 0.321 0.373 0.378 0.386 0.365 0.302 0.683 0.000 0.000 | 0.141 0.202 0.262 0.261 0.256 G: 0.120 0.115 0.110 0.084 0.062 0.065 0.223 0.001 0.000 1.000 | 0.539 0.205 0.275 0.221 0.228 T: 0.492 0.468 0.423 0.427 0.459 0.493 0.245 0.272 0.000 0.000 | 0.089 0.359 0.250 0.252 0.272 4d. Introns with weak donor sites (the 'weak' group) ---------------------------------------------------- distribution matrix for donor sites there were 225 sequences A: 0.316 0.236 0.271 0.333 0.169 | 0.000 0.000 0.547 0.080 0.271 0.240 0.249 0.267 0.320 0.236 C: 0.302 0.302 0.244 0.218 0.049 | 0.000 0.000 0.107 0.422 0.196 0.173 0.218 0.231 0.218 0.253 G: 0.120 0.156 0.191 0.276 0.618 | 1.000 0.000 0.133 0.178 0.240 0.329 0.302 0.267 0.218 0.276 T: 0.262 0.307 0.293 0.173 0.164 | 0.000 1.000 0.213 0.320 0.293 0.258 0.231 0.236 0.244 0.236 distribution matrix for acceptor sites there were 231 sequences A: 0.065 0.113 0.117 0.147 0.095 0.095 0.195 0.039 1.000 0.000 | 0.225 0.212 0.294 0.225 0.286 C: 0.286 0.299 0.398 0.390 0.437 0.299 0.264 0.697 0.000 0.000 | 0.139 0.212 0.247 0.234 0.247 G: 0.152 0.139 0.126 0.121 0.069 0.078 0.255 0.043 0.000 1.000 | 0.502 0.182 0.186 0.294 0.273 T: 0.498 0.450 0.359 0.342 0.398 0.528 0.286 0.221 0.000 0.000 | 0.134 0.394 0.273 0.247 0.195 4e. Introns with U12 type GT-AG splice sites (the 'U12' group) ------------------------------------------------------------- distribution matrix for donor sites there were 56 sequences A: 0.339 0.286 0.357 0.250 0.304 | 0.000 0.000 1.000 0.018 0.036 0.000 0.018 0.054 0.071 0.232 C: 0.161 0.214 0.214 0.357 0.196 | 0.000 0.000 0.000 0.036 0.875 0.911 0.000 0.107 0.196 0.250 G: 0.321 0.304 0.143 0.179 0.089 | 1.000 0.000 0.000 0.018 0.071 0.018 0.000 0.054 0.107 0.250 T: 0.179 0.196 0.286 0.214 0.411 | 0.000 1.000 0.000 0.929 0.018 0.071 0.982 0.786 0.625 0.268 distribution matrix for acceptor sites there were 60 sequences A: 0.167 0.250 0.150 0.317 0.200 0.150 0.167 0.117 1.000 0.000 | 0.533 0.100 0.517 0.083 0.167 C: 0.350 0.250 0.350 0.217 0.283 0.300 0.350 0.683 0.000 0.000 | 0.200 0.283 0.100 0.233 0.350 G: 0.150 0.167 0.233 0.200 0.183 0.133 0.133 0.000 0.000 1.000 | 0.167 0.033 0.150 0.133 0.217 T: 0.333 0.333 0.267 0.267 0.333 0.417 0.350 0.200 0.000 0.000 | 0.100 0.583 0.233 0.550 0.267 4f. Introns with GC-AG splice sites (the 'GC' group) ------------------------------------------------------------- distribution matrix for donor sites there were 165 sequences A: 0.279 0.248 0.303 0.800 0.055 | 0.000 0.000 0.673 0.515 0.115 0.145 0.218 0.158 0.194 0.248 C: 0.261 0.345 0.430 0.048 0.012 | 0.000 1.000 0.115 0.103 0.067 0.158 0.218 0.327 0.285 0.261 G: 0.200 0.261 0.206 0.061 0.891 | 1.000 0.000 0.073 0.236 0.745 0.200 0.400 0.218 0.273 0.297 T: 0.261 0.145 0.061 0.091 0.042 | 0.000 0.000 0.139 0.145 0.073 0.497 0.164 0.297 0.248 0.194 distribution matrix for acceptor sites there were 171 sequences A: 0.117 0.152 0.170 0.129 0.076 0.094 0.257 0.070 1.000 0.000 | 0.187 0.234 0.205 0.158 0.287 C: 0.339 0.357 0.263 0.298 0.339 0.298 0.251 0.550 0.000 0.000 | 0.111 0.368 0.246 0.205 0.246 G: 0.175 0.164 0.187 0.222 0.129 0.222 0.269 0.152 0.000 1.000 | 0.614 0.146 0.240 0.368 0.228 T: 0.368 0.327 0.380 0.351 0.456 0.386 0.222 0.228 0.000 0.000 | 0.088 0.251 0.310 0.269 0.240 5. Splice sites associated with cassette exons ============================================== 5a. splice sites for skipped exons ---------------------------------- distribution matrix for acceptor sites there were 526 sequences A: 0.095 0.080 0.114 0.118 0.082 0.093 0.232 0.065 1.000 0.000 | 0.253 0.207 0.247 0.251 0.253 C: 0.319 0.350 0.346 0.333 0.388 0.356 0.306 0.665 0.000 0.000 | 0.163 0.230 0.236 0.253 0.253 G: 0.125 0.116 0.116 0.108 0.084 0.095 0.188 0.010 0.000 1.000 | 0.458 0.226 0.260 0.262 0.247 T: 0.460 0.454 0.424 0.441 0.447 0.456 0.274 0.260 0.000 0.000 | 0.125 0.337 0.257 0.234 0.247 distribution matrix for donor sites there were 510 sequences A: 0.298 0.294 0.308 0.645 0.108 | 0.000 0.000 0.531 0.633 0.114 0.176 0.292 0.200 0.227 0.190 C: 0.276 0.261 0.367 0.108 0.025 | 0.000 0.000 0.037 0.096 0.059 0.149 0.178 0.255 0.263 0.261 G: 0.198 0.245 0.204 0.112 0.794 | 1.000 0.000 0.398 0.131 0.763 0.255 0.325 0.271 0.249 0.259 T: 0.227 0.200 0.122 0.135 0.073 | 0.000 1.000 0.033 0.139 0.065 0.420 0.204 0.275 0.261 0.290 5b. splice sites for introns covering skipped exons --------------------------------------------------- distribution matrix for donor sites there were 322 sequences A: 0.276 0.289 0.314 0.680 0.078 | 0.000 0.000 0.599 0.640 0.096 0.174 0.248 0.236 0.217 0.208 C: 0.276 0.286 0.425 0.099 0.037 | 0.000 0.000 0.037 0.106 0.084 0.186 0.227 0.304 0.270 0.298 G: 0.214 0.220 0.168 0.102 0.823 | 1.000 0.000 0.323 0.152 0.755 0.211 0.329 0.220 0.248 0.267 T: 0.233 0.205 0.093 0.118 0.062 | 0.000 1.000 0.040 0.102 0.065 0.429 0.196 0.239 0.264 0.227 distribution matrix for acceptor sites there were 318 sequences A: 0.044 0.072 0.107 0.110 0.072 0.066 0.179 0.075 1.000 0.000 | 0.258 0.261 0.239 0.252 0.239 C: 0.299 0.289 0.362 0.324 0.349 0.299 0.349 0.657 0.000 0.000 | 0.119 0.189 0.248 0.245 0.255 G: 0.135 0.129 0.135 0.085 0.060 0.075 0.211 0.016 0.000 1.000 | 0.522 0.182 0.248 0.248 0.248 T: 0.522 0.509 0.396 0.481 0.519 0.560 0.261 0.252 0.000 0.000 | 0.101 0.368 0.264 0.255 0.258 5c. splice sites for cryptic exons ---------------------------------- distribution matrix for acceptor sites there were 157 sequences A: 0.121 0.146 0.159 0.121 0.127 0.146 0.306 0.121 1.000 0.000 | 0.338 0.287 0.312 0.242 0.268 C: 0.248 0.287 0.261 0.318 0.287 0.261 0.287 0.605 0.000 0.000 | 0.115 0.197 0.185 0.299 0.229 G: 0.127 0.064 0.096 0.146 0.076 0.064 0.178 0.025 0.000 1.000 | 0.408 0.242 0.197 0.178 0.248 T: 0.503 0.503 0.484 0.414 0.510 0.529 0.229 0.248 0.000 0.000 | 0.140 0.274 0.306 0.280 0.255 distribution matrix for donor sites there were 154 sequences A: 0.292 0.403 0.299 0.623 0.078 | 0.000 0.000 0.617 0.552 0.117 0.188 0.292 0.182 0.247 0.247 C: 0.286 0.253 0.325 0.058 0.026 | 0.000 0.000 0.019 0.065 0.123 0.130 0.149 0.286 0.299 0.266 G: 0.201 0.143 0.247 0.162 0.818 | 1.000 0.000 0.299 0.221 0.682 0.227 0.286 0.240 0.201 0.188 T: 0.221 0.201 0.130 0.156 0.078 | 0.000 1.000 0.065 0.162 0.078 0.455 0.273 0.292 0.253 0.299 5d. splice sites for introns covering cryptic exons --------------------------------------------------- distribution matrix for donor sites there were 157 sequences A: 0.350 0.299 0.287 0.605 0.083 | 0.000 0.000 0.580 0.688 0.038 0.178 0.312 0.166 0.217 0.159 C: 0.197 0.274 0.401 0.115 0.025 | 0.000 0.000 0.013 0.070 0.096 0.166 0.204 0.299 0.274 0.299 G: 0.229 0.185 0.204 0.121 0.809 | 1.000 0.000 0.389 0.140 0.809 0.140 0.274 0.261 0.242 0.293 T: 0.223 0.242 0.108 0.159 0.083 | 0.000 1.000 0.019 0.102 0.057 0.516 0.210 0.274 0.268 0.248 distribution matrix for acceptor sites there were 164 sequences A: 0.067 0.079 0.110 0.116 0.098 0.104 0.213 0.061 1.000 0.000 | 0.280 0.287 0.250 0.244 0.256 C: 0.311 0.329 0.323 0.360 0.311 0.268 0.341 0.622 0.000 0.000 | 0.098 0.165 0.250 0.226 0.250 G: 0.098 0.104 0.085 0.079 0.037 0.079 0.201 0.000 0.000 1.000 | 0.543 0.165 0.201 0.238 0.201 T: 0.524 0.488 0.482 0.445 0.555 0.549 0.244 0.317 0.000 0.000 | 0.079 0.384 0.299 0.293 0.293 6. Splice sites associated with intron/exon truncation and extension events =========================================================================== 6a. Constitutive introns with alternative donor site isoforms ------------------------------------------------------------- distribution matrix for donor sites there were 114 sequences A: 0.237 0.228 0.289 0.570 0.105 | 0.000 0.000 0.430 0.561 0.105 0.175 0.263 0.298 0.167 0.202 C: 0.298 0.281 0.342 0.158 0.035 | 0.000 0.000 0.044 0.140 0.079 0.167 0.246 0.272 0.307 0.272 G: 0.202 0.246 0.211 0.149 0.754 | 1.000 0.000 0.482 0.175 0.728 0.254 0.377 0.202 0.333 0.298 T: 0.263 0.246 0.158 0.123 0.105 | 0.000 1.000 0.044 0.123 0.088 0.404 0.114 0.228 0.193 0.228 distribution matrix for acceptor sites there were 114 sequences A: 0.053 0.096 0.088 0.149 0.105 0.079 0.175 0.061 1.000 0.000 | 0.167 0.237 0.228 0.167 0.237 C: 0.412 0.325 0.342 0.342 0.412 0.386 0.333 0.702 0.000 0.000 | 0.193 0.202 0.202 0.246 0.289 G: 0.088 0.123 0.123 0.070 0.070 0.079 0.246 0.000 0.000 1.000 | 0.579 0.158 0.325 0.333 0.228 T: 0.447 0.456 0.447 0.439 0.412 0.456 0.246 0.237 0.000 0.000 | 0.061 0.404 0.246 0.254 0.246 6b. Alternative introns demonstrating donor site isoforms --------------------------------------------------------- distribution matrix for donor sites there were 118 sequences A: 0.322 0.212 0.271 0.551 0.034 | 0.000 0.000 0.390 0.415 0.127 0.195 0.288 0.212 0.203 0.212 C: 0.288 0.314 0.339 0.085 0.008 | 0.000 0.000 0.085 0.212 0.144 0.254 0.229 0.229 0.246 0.297 G: 0.169 0.322 0.237 0.178 0.805 | 1.000 0.000 0.449 0.203 0.559 0.280 0.280 0.237 0.331 0.288 T: 0.220 0.153 0.153 0.186 0.153 | 0.000 1.000 0.076 0.169 0.169 0.271 0.203 0.322 0.220 0.203 distribution matrix for acceptor sites there were 113 sequences A: 0.044 0.080 0.088 0.159 0.106 0.106 0.150 0.044 1.000 0.000 | 0.168 0.212 0.221 0.177 0.257 C: 0.425 0.327 0.336 0.319 0.398 0.354 0.336 0.690 0.000 0.000 | 0.195 0.212 0.221 0.257 0.274 G: 0.106 0.124 0.142 0.062 0.071 0.088 0.239 0.018 0.000 1.000 | 0.558 0.195 0.310 0.327 0.212 T: 0.425 0.469 0.434 0.460 0.425 0.451 0.274 0.248 0.000 0.000 | 0.080 0.381 0.248 0.239 0.257 6c. Constitutive introns with small (up to 10 nts) alternative acceptor site isoforms ------------------------------------------------------------------------------------- distribution matrix for donor sites there were 96 sequences A: 0.281 0.240 0.292 0.500 0.094 | 0.000 0.000 0.396 0.729 0.104 0.188 0.312 0.281 0.125 0.219 C: 0.271 0.354 0.427 0.073 0.021 | 0.000 0.000 0.062 0.094 0.042 0.219 0.240 0.292 0.250 0.260 G: 0.281 0.229 0.156 0.219 0.854 | 1.000 0.000 0.531 0.073 0.802 0.167 0.323 0.177 0.323 0.354 T: 0.167 0.177 0.125 0.208 0.031 | 0.000 1.000 0.010 0.104 0.052 0.427 0.125 0.250 0.302 0.167 distribution matrix for acceptor sites there were 96 sequences A: 0.073 0.115 0.146 0.062 0.104 0.208 0.167 0.083 1.000 0.000 | 0.260 0.573 0.198 0.333 0.354 C: 0.333 0.281 0.458 0.448 0.417 0.240 0.333 0.677 0.000 0.000 | 0.354 0.104 0.146 0.229 0.229 G: 0.115 0.125 0.083 0.062 0.062 0.125 0.292 0.031 0.000 1.000 | 0.250 0.104 0.594 0.271 0.260 T: 0.479 0.479 0.312 0.427 0.417 0.427 0.208 0.208 0.000 0.000 | 0.135 0.219 0.062 0.167 0.156 6d. Alternative introns demonstrating small (up to 10 nts) acceptor site isoforms --------------------------------------------------------------------------------- distribution matrix for donor sites there were 95 sequences A: 0.274 0.242 0.284 0.516 0.095 | 0.000 0.000 0.421 0.737 0.105 0.189 0.326 0.274 0.126 0.232 C: 0.274 0.358 0.453 0.074 0.021 | 0.000 0.000 0.053 0.095 0.042 0.189 0.221 0.284 0.242 0.242 G: 0.274 0.232 0.147 0.211 0.853 | 1.000 0.000 0.516 0.074 0.811 0.179 0.347 0.189 0.326 0.358 T: 0.179 0.168 0.116 0.200 0.032 | 0.000 1.000 0.011 0.095 0.042 0.442 0.105 0.253 0.305 0.168 distribution matrix for acceptor sites there were 95 sequences A: 0.053 0.084 0.189 0.189 0.168 0.537 0.200 0.200 1.000 0.000 | 0.274 0.400 0.211 0.326 0.221 C: 0.400 0.411 0.274 0.368 0.411 0.158 0.168 0.568 0.000 0.000 | 0.284 0.232 0.211 0.263 0.305 G: 0.105 0.116 0.137 0.200 0.147 0.116 0.547 0.116 0.000 1.000 | 0.263 0.211 0.389 0.221 0.242 T: 0.442 0.389 0.400 0.242 0.274 0.189 0.084 0.116 0.000 0.000 | 0.179 0.158 0.189 0.189 0.232 6e. Constitutive introns with large (greater than 10 nts) alternative acceptor site isoforms -------------------------------------------------------------------------------------------- distribution matrix for donor sites there were 132 sequences A: 0.220 0.258 0.295 0.606 0.076 | 0.000 0.000 0.447 0.727 0.076 0.121 0.235 0.182 0.174 0.197 C: 0.341 0.311 0.386 0.129 0.015 | 0.000 0.000 0.023 0.106 0.098 0.212 0.242 0.356 0.295 0.318 G: 0.212 0.212 0.121 0.129 0.864 | 1.000 0.000 0.523 0.068 0.788 0.205 0.356 0.242 0.273 0.258 T: 0.227 0.220 0.197 0.136 0.045 | 0.000 1.000 0.008 0.098 0.038 0.462 0.167 0.220 0.258 0.227 distribution matrix for acceptor sites there were 130 sequences A: 0.092 0.077 0.085 0.162 0.085 0.062 0.169 0.062 1.000 0.000 | 0.208 0.177 0.223 0.192 0.223 C: 0.400 0.400 0.346 0.392 0.477 0.431 0.362 0.677 0.000 0.000 | 0.169 0.300 0.277 0.277 0.315 G: 0.077 0.092 0.200 0.085 0.069 0.092 0.231 0.008 0.000 1.000 | 0.454 0.185 0.254 0.146 0.154 T: 0.431 0.431 0.369 0.362 0.369 0.415 0.238 0.254 0.000 0.000 | 0.169 0.338 0.246 0.385 0.308 6f. Alternative introns demonstrating large (greater than 10 nts) acceptor site isoforms ---------------------------------------------------------------------------------------- distribution matrix for donor sites there were 131 sequences A: 0.206 0.260 0.298 0.588 0.084 | 0.000 0.000 0.450 0.733 0.084 0.137 0.237 0.191 0.183 0.198 C: 0.359 0.290 0.366 0.145 0.015 | 0.000 0.000 0.031 0.115 0.099 0.198 0.237 0.351 0.282 0.313 G: 0.206 0.214 0.130 0.130 0.847 | 1.000 0.000 0.511 0.053 0.779 0.206 0.351 0.244 0.275 0.260 T: 0.229 0.237 0.206 0.137 0.053 | 0.000 1.000 0.008 0.099 0.038 0.458 0.176 0.214 0.260 0.229 distribution matrix for acceptor sites there were 131 sequences A: 0.137 0.145 0.122 0.145 0.107 0.122 0.206 0.122 1.000 0.000 | 0.237 0.260 0.160 0.168 0.221 C: 0.351 0.328 0.359 0.374 0.397 0.290 0.313 0.634 0.000 0.000 | 0.229 0.267 0.336 0.382 0.282 G: 0.137 0.099 0.183 0.137 0.122 0.099 0.221 0.046 0.000 1.000 | 0.435 0.198 0.252 0.198 0.221 T: 0.374 0.427 0.336 0.344 0.374 0.489 0.260 0.198 0.000 0.000 | 0.099 0.275 0.252 0.252 0.275 7. Splice sites associated with observed intron retention events ================================================================ 7a. Splice sites of exons that have retained introns ---------------------------------------------------- distribution matrix for acceptor sites of exons that retain introns there were 36 sequences A: 0.056 0.139 0.139 0.028 0.083 0.028 0.139 0.028 1.000 0.000 | 0.194 0.222 0.139 0.306 0.194 C: 0.417 0.306 0.500 0.389 0.444 0.528 0.472 0.778 0.000 0.000 | 0.167 0.111 0.306 0.222 0.361 G: 0.222 0.167 0.111 0.083 0.056 0.028 0.250 0.000 0.000 1.000 | 0.472 0.167 0.333 0.278 0.306 T: 0.306 0.389 0.250 0.500 0.417 0.417 0.139 0.194 0.000 0.000 | 0.167 0.500 0.222 0.194 0.139 distribution matrix for donor sites of exons that retain introns there were 38 sequences A: 0.289 0.237 0.211 0.632 0.053 | 0.000 0.000 0.342 0.711 0.053 0.132 0.132 0.105 0.105 0.158 C: 0.211 0.237 0.553 0.158 0.053 | 0.000 0.000 0.000 0.105 0.026 0.211 0.316 0.289 0.263 0.132 G: 0.237 0.237 0.158 0.053 0.868 | 1.000 0.000 0.605 0.105 0.868 0.263 0.342 0.342 0.342 0.368 T: 0.263 0.289 0.079 0.158 0.026 | 0.000 1.000 0.053 0.079 0.053 0.395 0.211 0.263 0.289 0.342 7b. Splice sites of retained introns ------------------------------------ distribution matrix for donor sites of retained introns 53 sequences A: 0.321 0.208 0.245 0.585 0.151 | 0.000 0.000 0.358 0.717 0.113 0.170 0.170 0.245 0.283 0.038 C: 0.264 0.358 0.453 0.189 0.019 | 0.000 0.000 0.094 0.057 0.094 0.094 0.226 0.283 0.283 0.358 G: 0.189 0.189 0.151 0.094 0.792 | 1.000 0.000 0.509 0.075 0.736 0.415 0.396 0.283 0.264 0.415 T: 0.226 0.245 0.151 0.132 0.038 | 0.000 1.000 0.038 0.151 0.057 0.321 0.208 0.189 0.170 0.189 distribution matrix for acceptor sites of retained introns 52 sequences A: 0.096 0.058 0.077 0.192 0.058 0.038 0.135 0.058 1.000 0.000 | 0.173 0.173 0.250 0.212 0.115 C: 0.288 0.385 0.500 0.365 0.423 0.481 0.327 0.731 0.000 0.000 | 0.154 0.288 0.212 0.269 0.269 G: 0.154 0.154 0.173 0.115 0.115 0.077 0.308 0.019 0.000 1.000 | 0.577 0.231 0.212 0.288 0.346 T: 0.462 0.404 0.250 0.327 0.404 0.404 0.231 0.192 0.000 0.000 | 0.096 0.308 0.327 0.231 0.269