リスト内包表記

 またいきなりよく分からない言葉が出てきました。まずは例を見てください。

#coding: shift-jis

s = "AbcdefgHIJklmnOPQRSTuVwxYZ"

lower = []
upper = []
for x in s:
  if ord(x) >91:
    lower.append(x)
  else :
    upper.append(x)

print "小文字なのは:" + str(lower)
print "大文字なのは:" + str(upper)
print "プログラムを終了します。"

raw_input()

出力画面
 小文字なのは:['b', 'c', 'd', 'e', 'f', 'g', 'k', 'l', 'm', 'n', 'u', 'w', 'x']
 大文字なのは:['A', 'H', 'I', 'J', 'O', 'P', 'Q', 'R', 'S', 'T', 'V', 'Y', 'Z']
 プログラムを終了します。
 これは今までの書き方。これと同じことをリスト内包表記で書くと

#coding: shift-jis

s = "AbcdefgHIJklmnOPQRSTuVwxYZ"

lower = [x for x in s if ord(x) >91] ←ここがリスト内包表記!!
upper = [x for x in s if ord(x) <91]

print "小文字なのは:" + str(lower)
print "大文字なのは:" + str(upper)
print "プログラムを終了します。"

raw_input()

 7行のfor文で書いていた内容がたった2行になりました。リスト内包表記は、たくさんの命令を一行に凝縮するワンライン・スクリプトの一種です。ある条件を満たすリストを一行で書いてしまう表記法です。では遊んでみましょう。

 インタラクティブシェルで試してみよう!

 まず最初は基本から

 >>> [x for x in range(1,11)]
 [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

 これは、range(1,11)と同じ結果を返すだけなので面白くないですね。でもリスト内包表記は係数xを使って変換できるので

 >>> [x+1 for x in range(1,11)]
 [2, 3, 4, 5, 6, 7, 8, 9, 10, 11]

 Xに1を足した演算をしてみました。べき乗演算(**)を使うと

 >>> [x**0.5 for x in range(1,11)]
 [1.0, 1.4142135623730952, 1.7320508075688772, 2.0, 2.23606797749979, 2.449489742
 783178, 2.6457513110645907, 2.8284271247461903, 3.0, 3.162277660168379]

 平方根のリストも簡単に作れちゃいます。分かりづらいですかね。

 >>> [(x,x**0.5) for x in range(1,11)]
 [(1, 1.0), (2, 1.4142135623730952), (3, 1.7320508075688772), (4, 2.0), (5,
 2.23606797749979), (6, 2.449489742783178), (7, 2.6457513110645907), (8,
 2.8284271247461903), (9, 3.0), (10, 3.162277660168379)]


 xと平方根のタプルリストにしてみました。別に変数は一つだけでなくてもいいです。

 >>> [x+y for x in range(10,51,10) for y in range(0,10)]
 [10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28,
 29,30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47,
 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59]

 xとyで入れ子にしてみました。
 if文を使って、条件を加えることもできます。

 >>> [x for x in range(1,11) if x%3 == 2]
 [2, 5, 8]

 これは1〜10までの数のうち3で割ると2余る数です。
 次のようにシーケンスのインデックスとしても使えます。

>>> s = "ABC"
>>> l = [s[-x-1] for x in range(len(s))]
>>> l
['C', 'B', 'A']

 最後に"素数"のリストを作ってみます。"素数"とは「1とその数以外に約数を持たない数」です。もう少し勉強して素因数分解を習うと素数で割れない数は"素数"ということが分かってきます。更に賢くなると、ある素数の2乗より小さい数で、ある素数もしくはそれよりも小さい素数で割れない数は素数であると分かってきます。
 なかなか難しいですね。このことをリスト内包表記を使って表現してみると

   [ ある数X if len([y for y in [素数リスト] if x % y == 0] ) == 0) ]

となります。なんとまあ暗号ですね。最小の素数リスト[2]から始まって、見つけた素数をどんどん素数リストに追加していくことをやってみます。


>>> sl= [2] ←元の素数リスト
>>> sl+=[x for x in range(max(sl)+1,max(sl)**2) if len([y for y in sl if x%y==0])==0]
>>> sl
[2, 3] ←1回目の結果
>>> sl+=[x for x in range(max(sl)+1,max(sl)**2) if len([y for y in sl if x%y==0])==0]
>>> sl
[2, 3, 5, 7] ←2回目の結果
>>> sl+=[x for x in range(max(sl)+1,max(sl)**2) if len([y for y in sl if x%y==0])==0]
>>> sl
[2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47] ←3回目の結果
>>> sl+=[x for x in range(max(sl)+1,max(sl)**2) if len([y for y in sl if x%y==0])==0]
>>> sl  ↓4回目の結果
[2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47, 53, 59, 61, 67, 71, 73, 79, 83, 89, 97, 101, 103, 107, 109, 113, 127, 131, 137, 139, 149, 151, 157, 163, 167, 173, 179, 181, 191, 193, 197, 199, 211, 223, 227, 229, 233, 239, 241, 251, 257, 263, 269, 271, 277, 281, 283, 293, 307, 311, 313, 317, 331, 337, 347, 349, 353, 359, 367, 373, 379, 383, 389, 397, 401, 409, 419, 421, 431, 433, 439, 443, 449, 457, 461, 463, 467, 479, 487, 491, 499, 503, 509, 521, 523, 541, 547, 557, 563, 569, 571, 577, 587, 593, 599, 601, 607, 613, 617, 619, 631, 641, 643, 647, 653, 659, 661, 673, 677, 683, 691, 701, 709, 719, 727, 733, 739, 743, 751, 757, 761, 769, 773, 787, 797, 809, 811, 821, 823, 827, 829, 839, 853, 857, 859, 863, 877, 881, 883, 887, 907, 911, 919, 929, 937, 941, 947, 953, 967, 971, 977, 983, 991, 997, 1009, 1013, 1019, 1021, 1031, 1033, 1039, 1049, 1051, 1061, 1063, 1069, 1087, 1091, 1093, 1097, 1103, 1109, 1117, 1123, 1129, 1151, 1153, 1163, 1171, 1181, 1187, 1193, 1201, 1213, 1217, 1223, 1229, 1231, 1237, 1249, 1259, 1277,1279, 1283, 1289, 1291, 1297, 1301, 1303, 1307, 1319, 1321, 1327, 1361, 1367, 1373, 1381, 1399, 1409, 1423, 1427, 1429, 1433, 1439, 1447, 1451, 1453, 1459, 1471, 1481, 1483, 1487, 1489, 1493, 1499, 1511, 1523, 1531, 1543, 1549, 1553, 1559, 1567, 1571, 1579, 1583, 1597, 1601, 1607, 1609, 1613, 1619, 1621, 1627, 1637, 16 57, 1663, 1667, 1669, 1693, 1697, 1699, 1709, 1721, 1723, 1733, 1741, 1747, 1753, 1759, 1777, 1783, 1787, 1789, 1801, 1811, 1823, 1831, 1847, 1861, 1867, 1871, 1873, 1877, 1879, 1889, 1901, 1907, 1913, 1931, 1933, 1949, 1951, 1973, 1979, 1987, 1993, 1997, 1999, 2003, 2011, 2017, 2027, 2029, 2039, 2053, 2063, 2069, 2081, 2083, 2087, 2089, 2099, 2111, 2113, 2129, 2131, 2137, 2141, 2143, 2153, 2161, 2179, 2203, 2207]


最後に
 リスト内包表記は長い表記を短くすることができます。何よりもパズルを組み立てるような面白さがあります。でも最後に示したリスト内包表記の例はどうでしょう。分かりにくいですよね。ある程度のリスト内包表記は、一目で何をやりたいはわかるため、スクリプトを読みやすくしますが、度を超えてしまうと逆に分かりづらくなります。クイズ合戦をしているならまだしも、そんなことをしているわけではないので、リスト内包表記の使用は程々にした方が良いと思います。