]> git.openfabrics.org - ~ardavis/dapl.git/commit
ucm, scm: UD mode triggers list_head assert with large scale alltoall test
authorArlin Davis <arlin.r.davis@intel.com>
Tue, 1 Oct 2013 21:03:51 +0000 (14:03 -0700)
committerArlin Davis <arlin.r.davis@intel.com>
Tue, 1 Oct 2013 21:03:51 +0000 (14:03 -0700)
commit3315b8148ba52da67e422cf9afe6fa35d2161885
tree207aa6e119a8a1280580bd8396e9c3ce6548254d
parent40bf5a11b3c8b9767fee95fdbb544c5ddb05777f
ucm, scm: UD mode triggers list_head assert with large scale alltoall test

1024+ ranks, IMB alltoall may hit assert when running Intel MPI in UD mode.

CR clean up was implemented with EP to CR references still linked.
During cr_accept, the CR remote_ia_address is linked to EP object
by mistake with UD mode. UD mode my have multiple CRs per EP so
no direct mappings to CR memory can exist unless RC mode which
always has one EP to CR mapping.

In scm, ucm: for CM object free with CR references the search and
unlinking from SP must be under SP lock to serialize. Also,
cleanup thread wakeup logic to only trigger the thread if
reference count indicates the need for more processing.

Signed-off-by: Arlin Davis <arlin.r.davis@intel.com>
dapl/common/dapl_cr_accept.c
dapl/openib_scm/cm.c
dapl/openib_ucm/cm.c
dapl/openib_ucm/dapl_ib_util.h