削除符号論文メモ:2022/10/21

タイトル:Deterministic Document Exchange Protocols, and Almost Optimal 
Binary Codes for Edit Errors
著者名: Kuan Cheng; Zhengzhong Jin; Xin Li; Ke Wu
雑誌名:Journal of the ACM
号数:-
DOI:https://doi.org/10.1145/3561046

Abstract:We study two basic problems regarding edit errors, document 
exchange and error correcting codes. Here, two parties try to exchange 
two strings with length roughly n and edit distance at most k, or one 
party tries to send a string of length n to another party through a 
channel that can introduce at most k edit errors. The goal is to use the 
least amount of communication or redundancy possible. Both problems have 
been extensively studied for decades, and in this paper we focus on 
deterministic document exchange protocols and binary codes for 
insertions and deletions (insdel codes). It is known that for small k (e.
g., k ≤ n/4), in both problems the optimal communication or redundancy 
size is Θ(klognk). In particular, this implies the existence of binary 
codes that can correct ε fraction of edit errors with rate 1−Θ(εlog(1ε)).
 However, known constructions are far from achieving these bounds.

In this paper we significantly improve previous results on both problems.
 For document exchange, we give an efficient deterministic protocol with 
communication complexity O(klog2nk). This significantly improves the 
previous best known deterministic protocol, which has communication 
complexity O(k2 + klog 2n) [4]. For binary insdel codes, we obtain the 
following results:

(1)

An explicit binary insdel code with redundancy O(klog2nk). In particular 
this implies an explicit family of binary insdel codes that can correct 
ε fraction of insertions and deletions with rate 1−O(εlog2(1ε))=1−O˜(ε). 
This significantly improves the previous best known result which only 
achieves rate 1−O˜(ε√) [15], [14], and is optimal up to a log(1ε) factor.

(2)

An explicit binary insdel code with redundancy O(klog n). This 
significantly improves the previous best known result of [6], which only 
works for constant k and has redundancy O(k2log klog n); and that of [4],
 which has redundancy O(k2 + klog 2n). Our code has optimal redundancy 
for k ≤ n1 − α, any constant 0 < α < 1. This is the first explicit 
construction of binary insdel codes that has optimal redundancy for a 
wide range of error parameters k.

In obtaining our results we introduce several new techniques. Most 
notably, we introduce the notion of ε-self matching hash functions and ε
-synchronization hash functions. We believe our techniques can have 
further applications in the literature.

 

タイトル:Constrained Channel Capacity for DNA-based Data Storage 
Systems
著者名:Kaixin Fan; Huaming Wu; Zihui Yan
雑誌名:IEEE Communications Letters
号数:-
DOI:10.1109/LCOMM.2022.3212200

Abstract:Deoxyribonucleic acid (DNA)-based data storage has grown 
rapidly due to its advantages with the increase in infrequently large 
amounts of data. However, when the maximum homopolymer runlength (RLL) 
of the DNA strand is large and the GC-content is either too high or too 
low, the DNA synthesis and sequencing processes are prone to 
substitution, deletion and insertion errors. To reduce errors in DNA 
synthesis and sequencing, we require that the DNA storage channel 
satisfies both k -RLL and strong-( l ,δ)-locally-GC-balanced constraints,
 where the former refers to the maximum homopolymer runlength in each 
sequence is at most k , and the latter refers to the number of G and C 
of every length-( l ’ ≥ l) subsequence is bounded between [ l ’/2-δ, l ’
/2+δ]. This constrained channel allows DNA data storage system to be 
less prone to errors during synthesis and sequencing and improves the 
success rate of Polymerase Chain Reaction (PCR) amplification. We 
propose a method to calculate the channel capacity. In particular, we 
provide a relationship between the 4-ary constrained channel capacity 
and the 2-ary constrained channel capacity, which makes it simpler to 
calculate the 4-ary constrained channel capacity.

 

タイトル:Generalization of Fibonacci Codes to the Non-Binary Case
著者名:Shmuel T. Klein; Tamar C. Serebro; Dana Shapira
雑誌名:IEEE Access
号数:-
DOI:10.1109/ACCESS.2022.3214820

Abstract:Motivated by expected technological developments in which the 
basic unit of storage might possibly be d -ary elements, with d > 2, and 
not just bits, we extend the traditional Fibonacci code to non-binary 
codes of higher order, and prove their theoretical properties, as 
follows: (1) these codes are fixed in advance , and therefore do not 
need to be generated for each new probability distribution, yielding 
very simple and fast encoding and decoding procedures; (2) the codes are 
prefix-free : no codeword in the code is the prefix of any other 
codeword; (3) the codes are complete : if one adjoins any other d -ary 
string as an additional codeword, the obtained extended set of codewords 
is not uniquely decipherable anymore, and is therefore not useful as it 
might lead to ambiguities; and (4) the codes provide robustness against 
decoding errors: the number of lost codewords in case of an error will 
be limited. An error is defined as a d -ary digit changing its value, or 
an insertion of an extraneous d -ary digit, or an erroneous deletion of 
a d -ary digit. We provide experimental results on the compression 
performance, illustrating that the compression efficiency of non-binary 
Fibonacci codes is very close to the savings achieved by the 
corresponding non-binary Huffman coding of the same order, while 
providing simplicity and robustness.

 


先の読めない展開

皆さん、お早うございます。
ホラー好きでお馴染みの萩原です。

ハワイに住んで
幸せを実感することの一つが、
 ホラー映画、ホラードラマが盛りだくさん
ってこと。
しあわせ~。

これまでの2か月間、
映画館にて
Pearl
NOPE
・Barbarian
・Smile
の4作品を楽しみました。

Pearlは、映画配給会社A24作品の X、Pearl、MaXXXine 3部作の2作目。
Xの殺人老婆Pearlの若かりし頃を描いた作品。
夢と希望に溢れていた女性が、なぜ殺人鬼になったのか。
その一端を垣間見れます。
なんと、Pearl役は、Xで主人公Maxineを演じたMia Goth!
超絶実力派俳優です。
Xで主人公、Pearlで主人公。

Pearl Official Trailer


そして次作のタイトルMaXXXineから察するに、3部作、全て主人公なの?!

とびきりの良作が続いている中でも、
僕の好み的に最もハマったのが
Barbarian
でした。

宣伝で使われている あらすじ を簡単に述べると:


民泊サイトで予約した一軒家に到着した女性主人公 Tess。
しかし家の中には見知らぬ男が居て、おそらくダブルブッキングだと主張する。
近隣に宿が無く夜遅い為、その日は仕方なく、Tessが寝室に、男がリビングのソファーに宿泊。
夜中、奇妙な声で目が覚めたTessは、寝室のドアが開いていることに気づく。
そして。。。


となると、あんな話かこんな話かとアレコレ推測しながら観ていたのですが、
 どれもこれも想像を遥に上回って裏切られました。。。
 次から次へと、先の読めない展開が続く。
 これは、すごい。
 面白い。

映像、音楽、展開、人物像などなど、次世代のホラー作品を垣間見ました。
さらに良かったのが、
 伏線を回収する気が感じられない。
 回収しても解説しない。
という脚本の妙。

名作でした。

Barbarian Official Trailer

映画の話ばかりでしたが、
ホラードラマも観てます。

・Chucky
・Creepshow
・American Horror Story: NYC

Chuckyは映画チャイルドプレイでお馴染みの殺人人形チャッキーから生まれたオリジナルテレビドラマ。
つい最近、シーズン2が放送開始となりました。
そこで、シーズン1をオンデマンドサービスで全て視聴。
人形が人を殺すだけでしょ?
テレビドラマにしたら、飽きられちゃうんじゃないの?
と、観る前は心配していたのですが。。。
チャッキーを軸に、こんなに話が展開できるのかと、感心しました。

現在放送中のシーズン2。
まだ2話までしか放送されていませんが、
さらに展開が拡がってます。
さあ、どうなることか。

そして、今週の水曜日(2022年10月19日)に始まるのが
American Horror Story: NYC
です。AHSシリーズのシーズン11。
11ですって!
人気の高さの証明ですね。
ちなみに萩原は、全シーズン、観ました。
偶然にもシーズン1の放送時にも、ハワイに住んでいました。
リアルタイムでシーズン1を毎週視聴してました。

NYCってことは、ニューヨークシティー!
治安が悪そう。
そういうタイプのホラーなの?
想像するだけでワクワクします。

ところで、アメリカのテレビで意味不明なのが、放送時間。
例を挙げましょう。
10月19日に始まる American Horror Story: NYC の放送予定時間。

 午後7時 エピソード1
 午後8時 エピソード2
つまり、2話一挙放送。
ここまでは分かる。

 午後9時 エピソード1
 午後10時 エピソード2
いきなり再放送。

 午後11時 エピソード1
 午後12時 エピソード2
連続再放送。

 午前1時 エピソード2
なぜか、2話目だけ、4回目の放送。

これはこれで
先の読めない展開。

AHS NYC TEASER
ちきん

ところで、
ハワイは野生の鶏が多いところです。
歩いていると、あちらこちらで、
ニワトリとすれ違います。

ハワイでは Chicken と言います。
僕が中学校時代の英語の授業で
 Chickenは「鶏肉」。
 生きているニワトリには使わない。
と習ったのですが。。
実際は、
「鶏肉」も「生きているニワトリ」も両方とも Chicken って言います。。。

ホラーからニワトリ画像へ。


カイルア

家の近くを歩いていたり、バスに乗ったりしていると、日本人観光客に出会うことがあります。
カイルアビーチもしくはラニカイビーチに向かう人たち、もしくはサイクリングを楽しむ人たち。
「ラニ」はハワイ語で「天国」。
「カイ」はハワイ語で「海」。
ラニカイビーチは全米で最も美しいビーチに選ばれたりしてます。

カイルアビーチはラニカイビーチの隣。
ラニカイよりも砂浜が広い。

カイルアビーチ

カイルアは市の名前。ハワイ州オアフ島カイルア市。
同類にホノルル市があります。ハワイ州オアフ島ホノルル市、みたいな。

カイルアの中心にはショッピングタウンがあります。
スーパーマーケットがひしめき合ってます。
Down to Earth Organic and Natural、
Foodland、
Safeway、
Target、
Times Supermarket、
Whole Foods Market。
これらが1つのエリアにずらっと。

住んでみて気づいたこと。
これらのスーパーで上手に買い物すると、
しっかり節約した生活ができる。
例えば、Safewayなら毎週金曜日がお買い得など。

スーパーマーケットだけでなく、
衣類、お土産、飲食店などがずらっと並ぶこのエリア。

飲食店の写真を幾つか。

バナナ スイーツのお店 Banan
Teddy’s Bigger Burger:ハワイのハンバーガーと言えばここ
GUY HAGI って何?(答:ハワイのお天気キャスターの名前)

ところで、観光事情がパンデミック前と大きく変わってる印象を受けてます。

パンデミック前
 中国 > 日本 > 韓国
という順序で見かけてました。
現在は
 中国 < 日本 < 韓国

特に韓国の若者が多い。20~30代のカップル。
日本人は、老夫婦もしくは家族3~4人組。

経済的な意味で、日本はアジア圏で抜かれちゃったのだろうな。
学術的な意味で、頑張っていかなきゃね。