画像セグメンテーションの正解ラベルの注釈方法

2年 ago

優斗, 朝陽

1 minute

画像セグメンテーションのタスクにおいて、アノーテーション（注釈）されたground truthとは、各ピクセルの正しいカテゴリや境界情報をラベル付けすることです。ground truthのアノーテーションの目的は、モデルをトレーニングして評価する基準を提供し、オブジェクトの境界と画像内の領域を正確に理解できるようにすることです。以下に、画像セグメンテーションground truthのアノーテーションに一般的に使用されるいくつかの方法を示します。

ピクセル単位アノテーション：最も一般的な方法は、各ピクセルに正しいカテゴリのラベルを付けること。異なるカテゴリを区別するため、さまざまな色や数字を使用します。この方法では、境界を手動で描いて、各ピクセルに正しいラベルを割り当てる必要があります。
境界の注釈：セグメンテーションタスクでは、オブジェクトの境界のみを注釈付けする必要がある場合があります。オブジェクトの境界は、線またはポリゴンを使用して注釈付けできます。この方法は、ピクセルレベルの注釈付けよりも簡単ですが、一部の詳細は失われる可能性があります。
領域アノテーション: 特定の用途ではオブジェクト全体の領域のみをマークし、境界やピクセルレベルの情報は詳細にマークする必要はありません。この方法は通常、大まかなセグメンテーションタスクに使用されています。
アノテーションツール: イメージセグメンテーションのための多くのアノテーションツールは、アノテーションの処理を簡素化し、スピードアップするために利用できます。これらのツールは、アノテーションを簡単に描画、編集、保存できるインターフェースを提供しているのが一般的です。

グラウンドトゥルースへのアノテーション作業を行う際は、どのような手法を用いる場合においても、下記に留意する必要があります。

正確性：分割されたグランドトゥルースが画像の実際の状況と合致していることを確認する。そのためには、画像を注意深く確認し、正しい境界や領域がマークされていることを確認する必要がある。
一貫性：注釈をできるだけ一貫性あるものにすること。複数のアノテーターが同一の注釈ルールや慣習に従ってアノテーションを行うことで、グランドトゥルースの一貫性を確保する。
読解性標記: 標記は、明確に読める必要があると共に、画像分割タスクの要件を満たす必要があります。ラベルは、カテゴリまたは境界に関連する必要があり、正しい位置に配置される必要があります。
保存と管理：準備した ground truth データは、その後の学習や評価に使用するよう適切に保存・管理しておく必要があります。ground truth データは、一般的なデータ形式（PNG、JPEG、XML、JSON など）で保存できます。