Armadilloフォーラム

2時間~5時間経過後に通信が出来ない状態が発生する件

kafka

2023年9月12日 12時46分

下記の現象について、質問させていただきます。

以下URLを参考にArmadillo IoT-G3Lをアクセスポイントとして動作するようにしました。
https://armadillo.atmark-techno.com/blog/615/9563

hostapdの設定ファイル(hostapd.conf)は添付のものを使用しております。
(SSID、パスワードは変更しております)

本Armadilloのアクセスポイントに接続し、Armadillo上で動作するWebサーバー(Apache2)に1分間隔で100KByte程度のデータを送信し続けますと、
2時間~5時間経過後に通信が出来ない状態が発生します。
その際に、

 ・通信できない状態となった後、Apache2のログ(access.log、error.log)には通信元からのアクセスしたログがない
  ※通信できる状態の時のアクセスしたログは残っている
 ・Windows PCからアクセスポイントのSSIDが確認できる
 ・Windows PCからアクセスポイントに接続するとDHCPでIPアドレスが割り当てられる
 ・Windows PCからアクセスポイントに接続後Armadilloにpingを送信しても応答が無い
 ・sudo system hostapd restartを実行することでpingが通り、再度通信が出来るようになる

という状態となります。

本現象につきまして、解決策または要因にお心当たりがございましたら、ご教示いただけますと幸いです。
現在はcronにて1時間ごとにsudo system hostapd restartを行うようにし、上記通信ができなくなる現象を回避しています。

なお、本ArmadilloのLinuxバージョンは

 Linux armadillo 4.9.133-at27 #2 SMP PREEMPT Mon Dec 26 21:42:43 JST 2022 armv7l GNU/Linux

です。

コメント

kafka

2023年9月12日 12時48分

「hostapd.conf」はこちらの添付のものとなります。

よろしくお願いいたします。

ファイル ファイルの説明
hostapd.conf

at_syunya.ohshio

2023年9月15日 13時34分

大塩です。

現象の確認のため、現象発生時周辺のsyslogをいただけますでしょうか。

以上です。

kafka

2023年9月21日 10時26分

ご返信、ありがとうございます。
現象発生時のsyslogを添付いたします。
正常にデータの受信が行えておったのですが、8/31に15:30~16:30 の1時間で停止しております。
※この時、STAとなるユニットを3台接続しておりますが、1台のみ接続した場合でも同様の現象が起こることを確認しております。

本事案につきまして、何等かの情報、ご見解をいただけますと幸いです。
よろしくお願い申し上げます。

ファイル ファイルの説明
var.tar.gz

at_syunya.ohshio

2023年10月3日 10時27分

大塩です。

ログの送付ありがとうございます。

> 正常にデータの受信が行えておったのですが、8/31に15:30~16:30 の1時間で停止しております。
> ※この時、STAとなるユニットを3台接続しておりますが、1台のみ接続した場合でも同様の現象が起こることを確認しております。

ログを確認したところ、動作中にはカーネルのエラー文が頻繫に発生しているように見えます。
カーネルについては古いバージョンをご利用のようですので、バージョンアップを行い同様の現象が発生するかご確認いただけますでしょうか。

また、以下のバージョンの確認をお願い致します。
・u-boot バージョン
・dpkg -l | grep modemmanager

以上です。

kafka

2023年10月4日 16時15分

大塩様

お世話になっております。
バージョンアップしまして、動作を確認いたしまして、結果をご報告いたします。
ご記載いただきました2点のバージョンは下記となります。

・u-bootバージョン:2016.07-at23 (Mar 25 2022 - 16:42:41 +0900)
・dpkg -l | grep modemmanager 結果:1.10.0-1atmark3 armhf D-Bus service for managing modems

以上、よろしくお願いいたします。

> 大塩です。
>
> ログの送付ありがとうございます。
>
> > 正常にデータの受信が行えておったのですが、8/31に15:30~16:30 の1時間で停止しております。
> > ※この時、STAとなるユニットを3台接続しておりますが、1台のみ接続した場合でも同様の現象が起こることを確認しております。
>
> ログを確認したところ、動作中にはカーネルのエラー文が頻繫に発生しているように見えます。
> カーネルについては古いバージョンをご利用のようですので、バージョンアップを行い同様の現象が発生するかご確認いただけますでしょうか。
>
> また、以下のバージョンの確認をお願い致します。
> ・u-boot バージョン
> ・dpkg -l | grep modemmanager
>
> 以上です。

kafka

2023年10月6日 14時53分

大塩様

お世話になっております。
カーネルのバージョンアップを実施し、動作を確認しましたが、
同現象が発生しておる状況です。
データ通信が停止するという根幹に関わる機能ですので、窮しております。
この他、改善につながる情報やお気づきになられる点などございますでしょうか。

何卒、よろしくお願いいたします。

> 大塩様
>
> お世話になっております。
> バージョンアップしまして、動作を確認いたしまして、結果をご報告いたします。
> ご記載いただきました2点のバージョンは下記となります。
>
> ・u-bootバージョン:2016.07-at23 (Mar 25 2022 - 16:42:41 +0900)
> ・dpkg -l | grep modemmanager 結果:1.10.0-1atmark3 armhf D-Bus service for managing modems
>
> 以上、よろしくお願いいたします。
>
>
> > 大塩です。
> >
> > ログの送付ありがとうございます。
> >
> > > 正常にデータの受信が行えておったのですが、8/31に15:30~16:30 の1時間で停止しております。
> > > ※この時、STAとなるユニットを3台接続しておりますが、1台のみ接続した場合でも同様の現象が起こることを確認しております。
> >
> > ログを確認したところ、動作中にはカーネルのエラー文が頻繫に発生しているように見えます。
> > カーネルについては古いバージョンをご利用のようですので、バージョンアップを行い同様の現象が発生するかご確認いただけますでしょうか。
> >
> > また、以下のバージョンの確認をお願い致します。
> > ・u-boot バージョン
> > ・dpkg -l | grep modemmanager
> >
> > 以上です。

at_syunya.ohshio

2023年10月10日 14時05分

大塩です。

バージョンアップの作業とご確認ありがとうございます。

> カーネルのバージョンアップを実施し、動作を確認しましたが、
> 同現象が発生しておる状況です。

いただいている情報とご確認いただいた内容から、hostapd が原因であると考えております。(hostapd を再起動すると問題が一時的に解消されるため)
暫定対策としては、すでに行っていただいているcron によるサービス再起動をしていただくのが最適かと思いますが、
恒久対策を行うための現象原因切り分けとしまして、以下をご確認いただけますでしょうか。
・hostapd のバージョン確認と最新にアップデートした状態での動作確認
 以下を確認しますと、hostapd の最新は2.10 となっていますので、バージョン差分がある場合はアップデート後に同様の現象が発生するかご確認いただけますでしょうか。
 https://w1.fi/hostapd/
 バージョン確認方法は以下です。

hostapd -v

・G3L 最新インストールディスクイメージに同様の環境を作成いただき、動作確認

確実な解決方法とならず申し訳ありませんが、動作確認のほど宜しくお願い致します。

kafka

2023年10月17日 10時57分

大塩様

お世話になっております。
ご教示いただきました件、確認しましたのでご報告申し上げます。

【hostapdのバージョン更新について】
hostapdが停止する件:修正されず同様の現象が発生することを確認しております。(hostapdの再起動で復旧)

【最新イメージでの動作について】
hostapdが停止する件:修正されず同様の現象が発生することを確認しております。(hostapdの再起動で復旧)

尚、下記wifiモジュールのアップデートについて下記のエラーが出ております。
最新のwi-fiモジュールを組み込んだカーネルにて起動しますと、

[ 73.430792] wlcore: ERROR Your WiFi FW version (8.9.1.0.0) is invalid.
[ 73.446379] wlcore: ERROR error getting static data
[ 73.930403] wlcore: ERROR Your WiFi FW version (8.9.1.0.0) is invalid.
[ 73.945986] wlcore: ERROR error getting static data
[ 74.430598] wlcore: ERROR Your WiFi FW version (8.9.1.0.0) is invalid.
[ 74.446183] wlcore: ERROR error getting static data
[ 74.450847] wlcore: ERROR firmware boot failed despite 3 retries

のエラーが発生することを確認しております。
これらのエラーは本件に関係がございますでしょうか?
或いは、何か別な事柄に関係するエラーでしょうか?

なお補足としまして、カーネルビルドを行った環境は以下の通りです。

 仮想環境:ATDE8
 ビルドに使用したカーネルソース:4.9-x1-at30
 initramfs:x1-v2.1.1

ビルド時にカーネルのパッチを当てる必要があるとの記載がありましたので、

 $patch -p1 < /patches/kernel_patches/4.19.38/0023-wlcore-Fixing-PN-drift-on-encrypted-link-after-recov.patch

コマンドにてパッチを当てた状態でカーネルのビルドを実施しております。
ご回答をお待ち申し上げております。

以上、何卒、よろしくお願いいたします。

> 大塩です。
>
> バージョンアップの作業とご確認ありがとうございます。
>
> > カーネルのバージョンアップを実施し、動作を確認しましたが、
> > 同現象が発生しておる状況です。
>
> いただいている情報とご確認いただいた内容から、hostapd が原因であると考えております。(hostapd を再起動すると問題が一時的に解消されるため)
> 暫定対策としては、すでに行っていただいているcron によるサービス再起動をしていただくのが最適かと思いますが、
> 恒久対策を行うための現象原因切り分けとしまして、以下をご確認いただけますでしょうか。
> ・hostapd のバージョン確認と最新にアップデートした状態での動作確認
>  以下を確認しますと、hostapd の最新は2.10 となっていますので、バージョン差分がある場合はアップデート後に同様の現象が発生するかご確認いただけますでしょうか。
>  https://w1.fi/hostapd/
>  バージョン確認方法は以下です。
>

> hostapd -v
> 

>
> ・G3L 最新インストールディスクイメージに同様の環境を作成いただき、動作確認
>
> 確実な解決方法とならず申し訳ありませんが、動作確認のほど宜しくお願い致します。

at_syunya.ohshio

2023年10月18日 16時23分

大塩です。

ご確認ありがとうございます。

hostapd , image 共に変更しても動作が改善されない件、把握しました。

> 尚、下記wifiモジュールのアップデートについて下記のエラーが出ております。
> 最新のwi-fiモジュールを組み込んだカーネルにて起動しますと、
>
> [ 73.430792] wlcore: ERROR Your WiFi FW version (8.9.1.0.0) is invalid.
> [ 73.446379] wlcore: ERROR error getting static data
> [ 73.930403] wlcore: ERROR Your WiFi FW version (8.9.1.0.0) is invalid.
> [ 73.945986] wlcore: ERROR error getting static data
> [ 74.430598] wlcore: ERROR Your WiFi FW version (8.9.1.0.0) is invalid.
> [ 74.446183] wlcore: ERROR error getting static data
> [ 74.450847] wlcore: ERROR firmware boot failed despite 3 retries
>
> のエラーが発生することを確認しております。
> これらのエラーは本件に関係がございますでしょうか?
> 或いは、何か別な事柄に関係するエラーでしょうか?

上記につきまして、おそらく正常にパッチが当たっていないことが原因により
8.9.1.0.0 バージョンが認識できずに コンボモジュールのファームウェアがエラーを起こしているように見えます。

>
>  $patch -p1 < /patches/kernel_patches/4.19.38/0023-wlcore-Fixing-PN-drift-on-encrypted-link-after-recov.patch
>
> コマンドにてパッチを当てた状態でカーネルのビルドを実施しております。

上記コマンドが/patches/ ... となっていますので、 patches/ ... に変更してパッチが当たるかご確認いただけますでしょうか。
記載内容から、おそらく参照先のpatch ページを実行し、作成された 0023-wlcore-Fixing-PN-drift-on-encrypted-link-after-recov.patch を実行していると思われます。
linux-4.9 直下で このパッチを実行した場合、linux-4.9/patches/... に 0023-wlcore-Fixing-PN-drift-on-encrypted-link-after-recov.patch が存在しているはずです。

以上です。

kafka

2023年11月14日 12時42分

大塩様

ご回答が遅くなり、申し訳ございません。

カーネルのパッチについて記載されておりましたので、試行致しました。
そのところカーネルビルド時にエラーが出力される形となっております。
添付のコマンド実行時ログがカーネルのパッチ実行時のログとなります。

ご確認の程、よろしくお願いいたします。

また、こちらのシステム仕様としましては、ステーション機器を最大10台をArmadilloへ接続させて使用します。
各ステーションは数分周期でWi-Fi接続を行い、データを送信後、接続を切断し、次の周期へ備えてスリープします。
最大10台ではなくとも、例えば3台接続時でもhostapdが停止する場合がございます。
※Wi-Fi接続による処理負荷が高くなることとhostapdの停止は因果関係にあると考えてよいのでしょうか。
Armadilloの停止(受信負荷状態)がWi-Fi接続動作の処理負荷にある場合、
使用に足るWi-Fiの接続動作の頻度と台数はどの程度かという目安が判れば、システムの運用を設計出来ると考えております。

現在は、定期的にhostapdを再起動することで、暫定対策として逃げておりますが、一部弊害がある状態です。

以上、お手数ですが、よろしくお願いいたします。

> 大塩です。
>
> ご確認ありがとうございます。
>
> hostapd , image 共に変更しても動作が改善されない件、把握しました。
>
> > 尚、下記wifiモジュールのアップデートについて下記のエラーが出ております。
> > 最新のwi-fiモジュールを組み込んだカーネルにて起動しますと、
> >
> > [ 73.430792] wlcore: ERROR Your WiFi FW version (8.9.1.0.0) is invalid.
> > [ 73.446379] wlcore: ERROR error getting static data
> > [ 73.930403] wlcore: ERROR Your WiFi FW version (8.9.1.0.0) is invalid.
> > [ 73.945986] wlcore: ERROR error getting static data
> > [ 74.430598] wlcore: ERROR Your WiFi FW version (8.9.1.0.0) is invalid.
> > [ 74.446183] wlcore: ERROR error getting static data
> > [ 74.450847] wlcore: ERROR firmware boot failed despite 3 retries
> >
> > のエラーが発生することを確認しております。
> > これらのエラーは本件に関係がございますでしょうか?
> > 或いは、何か別な事柄に関係するエラーでしょうか?
>
> 上記につきまして、おそらく正常にパッチが当たっていないことが原因により
> 8.9.1.0.0 バージョンが認識できずに コンボモジュールのファームウェアがエラーを起こしているように見えます。
>
> >
> >  $patch -p1 < /patches/kernel_patches/4.19.38/0023-wlcore-Fixing-PN-drift-on-encrypted-link-after-recov.patch
> >
> > コマンドにてパッチを当てた状態でカーネルのビルドを実施しております。
>
> 上記コマンドが/patches/ ... となっていますので、 patches/ ... に変更してパッチが当たるかご確認いただけますでしょうか。
> 記載内容から、おそらく参照先のpatch ページを実行し、作成された 0023-wlcore-Fixing-PN-drift-on-encrypted-link-after-recov.patch を実行していると思われます。
> linux-4.9 直下で このパッチを実行した場合、linux-4.9/patches/... に 0023-wlcore-Fixing-PN-drift-on-encrypted-link-after-recov.patch が存在しているはずです。
>
> 以上です。

ファイル ファイルの説明
kernelビルド時エラーログ.txt
コマンド実行時ログ.txt

at_syunya.ohshio

2023年11月14日 15時49分

大塩です。

> そのところカーネルビルド時にエラーが出力される形となっております。

申し訳ありません。
ご確認いただいているパッチはそのまま適用することが出来ないため、手動で一部修正する必要があります。

こちらでパッチを適用させてビルドしたLinuxカーネルがございますので、送付致します。
また、カーネルバージョン at30 に適用可能なパッチも送付いたしますので、カーネルをビルドする必要がある場合はそちらをご利用ください。

パッチ適用後、無線LANを使用できることは確認しておりますので、こちらで動作確認をしてみてください。
動作確認環境は以下です。
・Linuxカーネル at30
・WLANファームウェア 8.9.1.0.0

以上です。

ファイル ファイルの説明
patch適用kernel.zip パッチを適用したLinuxカーネル
wlcore-Fixing-PN-drift-on-encrypted-link-after-recov.patch 手動修正後のパッチ

kafka

2024年1月24日 17時48分

大塩様

ご回答が遅くなり申し訳ございません。
添付いただきましたもので、ビルドに成功しました。
こちらで確認してみる予定です。

添付いただいた方法で現象が改善しない場合、
その他、試してみる内容はございますでしょうか?

以上、よろしくお願いいたします。

> 大塩です。
>
> > そのところカーネルビルド時にエラーが出力される形となっております。
>
> 申し訳ありません。
> ご確認いただいているパッチはそのまま適用することが出来ないため、手動で一部修正する必要があります。
>
> こちらでパッチを適用させてビルドしたLinuxカーネルがございますので、送付致します。
> また、カーネルバージョン at30 に適用可能なパッチも送付いたしますので、カーネルをビルドする必要がある場合はそちらをご利用ください。
>
> パッチ適用後、無線LANを使用できることは確認しておりますので、こちらで動作確認をしてみてください。
> 動作確認環境は以下です。
> ・Linuxカーネル at30
> ・WLANファームウェア 8.9.1.0.0
>
> 以上です。